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前 言 


深度 学 习 模型 因为 阿尔 法 狗 战胜 了 人 类 围棋 冠军 而 一 举 成 名 ,再 加 上 BAT( 百 度 、 阿 里 
巴巴 .腾讯 ) ,谷歌 等 国内 外 知名 公司 的 推崇 ,使 得 深度 学 习 模 型 的 研究 热浪 一 波 高 过 一 波 。 
深度 学 习 模型 之 所 以 能 使 得 一 度 被 打 入 冷 宫 的 神经 网 络 重新 受到 了 大 众 的 宠爱 ,主要 因为 
深度 学 习 模 型 能 用 非 监 督 式 或 半 监 督 式 的 特征 学 习 和 分 层 特征 提取 高 效 算法 来 替代 手工 获 
取 特 征 , 从 而 使 得 过 去 被 废弃 的 大 量 非 标 签 数据 在 神经 网 络 中 得 到 了 利用 ; 更 为 重要 的 是 ， 
使 得 神经 网 络 的 深度 得 到 极 大 的 增加 ,从 而 极 大 地 提高 了 神经 网 络 的 处 理 能 力 。 深 度 学 习 
模型 虽然 是 一 个 初生 儿 , 但 辈分 极 高 ,因为 其 前 身 是 具有 您 久 历史 的 神经 网 络 ,在 20 年 前 ， 
我 上 大 学 期 间 就 有 一 门 课程 , 称 为 “神经 网 络 "。 虽 然 辈分 很 高 ,但 毕竟 是 初生 儿 ,毕竟 是 一 
个 新 的 生命 ,所 以 不 论 在 理论 上 还 是 在 应 用 上 ,都 存在 着 很 多 盲点 和 缺陷 ,都 需要 开拓 和 创 

深度 学 习 模型 的 春雨 过 后 ,无 人 驾驶 .图像 识 别 等 人 工 智能 相关 的 应 用 如 雨后春笋 层 出 
不 穷 。 随 着 应 用 的 深度 开展 ,其 理论 研究 也 在 如 火 如 蔡 地 展开 。 很 多 企业 和 高 校 已 经 成 立 
了 深度 学 习 研 究 中 心 或 小 组 ,专门 研究 深度 学 习 模型 的 相关 理论 和 应 用 ,同时 深度 学 习 模型 
方面 的 培训 和 课程 也 在 国内 外 掀起 了 热潮 ,但 困境 是 深度 学 习 模 型 理论 和 应 用 相关 的 著作 
仍然 比较 缺乏 。 

在 深度 学 习 模 型 火热 之 前 ,大 数据 已 经 热 了 几 年 ,而 深度 学 习 模 型 的 出 现 给 大 数据 的 智 
能 处 理 提供 了 一 个 新 的 出 路 。 深 度 学 习 模 型 只 有 基于 大 数据 才能 发 挥 其 威力 ,才能 达到 很 
高 的 准确 度 。 而 大 数据 在 应 用 了 深度 学 习 之 后 所 能 达到 的 处 理 效果 也 是 传统 算法 所 无 法 企 
及 的 。 可 以 说 ,两 者 相得益彰 ,相互 促进 ,互利 共 赢 。 

本 书 可 以 作为 学 习 和 研究 深度 学 习 模 型 的 学 生 和 学 者 的 参考 用 书 , 其 中 的 理论 部 分 可 
以 用 于 完善 现 有 深度 学 习 模 型 方法 的 不 足 , 为 理论 的 创新 英 定 基础 ; 其 中 的 应 用 部 分 可 以 
为 企业 提供 更 多 的 深度 学 习 模 型 应 用 思路 和 方案 ,进而 使 得 深度 学 习 模 型 在 实践 中 产生 更 
大 的 价值 。 

本 书 的 所 有 内 容 都 是 作者 原创 性 的 研究 成 果 。 本 书 的 原创 性 在 于 首次 提出 并 研究 给 出 
了 组 合 型 深度 学 习 模 型 智能 型 深度 学 习 模 型 适应 型 深度 学 习 模 型 ; 首次 提出 并 研究 给 出 
了 三 种 组 合 型 深度 学 习 模 型 ,包括 基于 类 别 树 的 深度 学 习 模 型 .基于 联合 聚 类 深度 学 习 模 型 
的 数据 识别 、 基 于 深度 学 习 模 型 的 身份 识别 ; 首次 提出 并 研究 给 出 了 两 种 智能 型 深度 学 习 
模型 ,包括 基于 大 数据 的 深度 学 习 模型 初始 化 、 深 度 学 习 模 型 进化 ; 首次 提出 并 研究 给 出 了 
两 种 适应 型 深度 学 习 模 型 ,包括 期 望 与 反 期 望 深度 学 习 模 型 .残缺 深度 学 习 模 型 ; 首次 提出 
并 研究 给 出 了 两 种 深度 学 习 模型 的 预报 预测 大 数据 应 用 ,包括 基于 大 数据 深度 学 习 和 分 析 
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场 的 气象 预报 、 分 析 预 测 文化 冲突 的 深度 学 习 模 型 ; 首次 提出 并 研究 给 出 了 三 种 深度 学 习 
模型 的 调度 推荐 大 数据 应 用 ,包括 基于 大 数据 和 深度 学 习 模 型 的 云 计算 调度 、 基 于 大 数据 和 
深度 学 习 模 型 的 停车 引导 、 基 于 大 数据 与 深度 学 习 的 婚恋 对 象 匹 配 推荐 ; 首次 提出 并 研究 
给 出 了 两 种 深度 学 习 模 型 的 检测 诊断 大 数据 应 用 ,包括 基于 深度 学 习 模 型 和 大 数据 的 停车 
位 检测 .基于 深度 学 习 模型 面向 自动 诊断 的 医疗 数据 处 理 。 

本 书 选取 的 是 人 工 智能 的 前 沿 领域 和 热点 领域 深度 学 习 模 型 ,但 与 各 个 应 用 领域 进行 
了 交叉 创新 ,并 在 交叉 创新 的 过 程 中 发 现 和 改进 了 现 有 深度 学 习 模 型 理论 的 不 足 , 同 时 拓展 
了 现 有 深度 学 习 模 型 的 应 用 范围 ,进而 实现 了 现 有 深度 学 习 模 型 技术 基础 上 从 理论 到 应 用 
的 创新 。 

本 书 中 的 研究 得 到 了 国家 级 新 工科 研究 与 实践 项 目 ( 粤 教 高 函 [2018】17 号 )、 国 家 社会 
科学 基金 重大 项 目 (14ZDB101)、 国 家 自然 科学 基金 重点 项 目 (41630635)、 教 育 部 一 腾讯 公 
司 产 学 合作 协同 育 人 项 目 (201602001001) 广东 高 校 重大 科研 项 目 ( 粤 教科 函 [2018】64) 、 广 
东 省 新 工科 研究 与 实践 项 目 ( 粤 教 高 函 [2017】118 号 ) .广东 省 高 等 教育 教学 研究 和 改革 重 
点 项 目 ( 粤 教 高 函 [2016】236 号 ) .广东 省 学 位 与 研究 生 教育 改革 研究 重点 项 目 ( 粤 教研 函 
(2016939 号 ) 广东 省 联合 培养 研究 生 示 范 基 地 ( 粤 教 研 函 [2016】39 号 ) 的 支持 。 

本 书 的 特色 在 于 以 深度 学 习 模 型 应 用 牵引 深度 学 习 模型 理论 的 创新 ,同时 以 深度 学 习 
模型 理论 的 创新 促进 深度 学 习 模型 应 用 的 创新 ,在 深度 学 习 模型 与 各 行 各 业 之 间 进 行 了 大 
胆 的 交叉 创新 ,从 而 使 得 深度 学 习 模型 技术 更 智能 、 更 普 适 、 更 精准 、 更 强大 ,进而 加 速 深度 
学 习 模 型 智能 应 用 的 发 展 。 当 然 , 深 入 后 必 能 浅 出 ,因此 读者 通过 本 书 也 能 根据 深度 学 习 模 
型 的 新 理论 ,新 方法 和 新 应 用 加 深 对 现 有 深度 学 习 技 术 的 理解 和 应 用 。 


华南 师范 大 学 
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组 合 型 深度 学 习 模 型 


将 现 有 技术 中 单个 深度 学 习 模 型 组 合 起 来 ,能够 优势 互补 ,从 而 实现 更 为 强大 的 功能 或 
更 好 的 性 能 。 本 章 介绍 了 三 部 分 内 容 : 基于 类 别 树 的 深度 学 习 模型 .基于 联合 聚 类 的 深度 
学 习 模 型 的 数据 识别 、 基 于 深度 学 习 模型 的 身份 识别 。 基 于 类 别 树 的 深度 学 习 模 型 ,通过 多 
级 深度 学 习 模型 的 逐 层 训练 和 逐 层 应 用 ,降低 了 输入 项 数 和 输出 类 别 数 ,从 而 降低 了 各 级 深 
度 学 习 模 型 的 结构 复杂 性 及 训练 和 应 用 难度 ,降低 了 深度 学 习 模 型 的 计算 复杂 度 ,同时 提高 
了 深度 学 习 模 型 的 准确 率 。 基 于 联合 聚 类 深度 学 习 模 型 的 数据 识别 方法 ,步骤 如 下 : DK 
取 N 类 数据 样本 集 及 对 应 的 标签 集 并 进行 预 处 理 , 同 时 获取 数据 预 设 格式 .标签 预 设 格式 ; 
加 对 深度 学 习 模 型 进行 训练 ; 加 将 每 一 类 任 一 测试 数据 转化 为 该 类 数据 预 设 格式 后 作为 该 
类 深度 学 习 模 型 的 输入 ,得 到 对 应 的 测试 输出 标签 ; 田 根据 测试 输出 标签 所 在 标签 集 的 元 
素 个 数 及 数据 集 之 间 的 相似 度 计算 ,确定 可 能 输出 标签 及 最 优 输出 标签 ; 加 计算 各 类 输出 
标签 一 致 和 不 一 致 的 概率 ; @ 将 可 能 、 最 优 输 出 标签 及 上 步 中 的 概率 输出 。 本 技术 通过 相 
似 度 计算 弥补 了 深度 学 习 模 型 输出 标签 数量 多 而 输入 样本 量 不 足 时 输出 准确 性 低 的 不 足 ， 
进而 提高 输出 的 准确 性 。 基 于 深度 学 习 模 型 的 身份 识别 方法 ,步骤 为 : 四 获取 N 类 输入 数 
据 ; @ 初 始 化 对 应 的 N 类 深度 学 习 模 型 ; 四 训练 N 类 深度 学 习 模 型 ; @ 根 据 采集 成 本 从 低 
到 高 对 类 别 进行 排序 ; @ 初 始 化 永 最 优 输 出 标签 L、 最 大 相似 度 相对 比值 U; @ 计 算 T; 类 
测试 输出 标签 ,并 判断 工 是 否 与 L; 相同 ; 四 获取 T 类 相似 度 相 对 比值 U; ,并 根据 上 一 
步 的 结果 判别 是 身份 识别 失败 还 是 执行 下 一 步 ; OHM LMU; OH U 与 预 设 最 大 相似 
度 相 对 比值 c 的 关系 与 N 的 关系 ,判别 身份 是 否 识 别 成 功 、 是 否 需 要 将 i 加 1 继续 循环 执 
行 。 本 技术 优先 选择 低 成 本 测试 数据 ,并 逐渐 增加 测试 输入 类 型 ,在 最 低 成 本 的 情况 下 能 够 
取得 最 高 的 判别 准确 率 。 
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1.1 基于 类 别 树 的 深度 学 习 模 型 


深度 学 习 模型 通过 输入 数据 和 输出 数据 对 深度 学 习 模型 进行 训练 2 。 传 统 的 深度 学 
习 模型 当 输 入 项 数 和 输出 类 别 数 过 多 时 ,就 会 导致 输入 数据 及 输出 数据 的 量 过 大 ,从 而 使 得 
深度 学 习 模型 的 结构 过 于 复杂 ; 深度 学 习 模 型 在 训练 时 计算 量 过 于 庞大 ,甚至 无 法 收敛 ,从 

影响 训练 的 质量 ,进而 导致 应 用 时 的 准确 度 降 低 。 

综 上 所 述 , 传 统 的 深度 学 习 模型 当 输 入 项 数 和 输出 类 别 数 过 多 时 准确 度 较 低 。 

本 节 研 究 并 给 出 了 一 种 新 的 基于 类 别 树 的 深度 学 习 方法 和 神经 网 络 系统 ,通过 多 级 深 
度 学 习 模 型 逐 层 训练 和 逐 层 应 用 ,降低 了 输入 项 数 和 输出 类 别 数 , 从 而 降低 了 各 级 深度 学 习 
模型 的 结构 复杂 性 及 训练 和 应 用 难度 ,降低 了 深度 学 习 模 型 的 计算 复杂 度 ,同时 提高 了 深度 
学 习 模型 的 准确 率 。 


1.1.1 基于 类 别 树 的 深度 学 习 方法 


1. 基于 类 别 树 深度 学 习 的 基本 方法 
图 1-1 提供 了 一 种 基于 类 别 树 的 深度 学 习 方 法 ,可 包括 以 下 步骤 。 


ro 


获取 训练 数据 中 输出 数据 对 应 的 类 别 树 


| Vax 
根据 类 别 树 分 别 构造 各 个 tent 子 节点 对 应 的 深度 学 习 模 型 ， 深 度 学 习 模型 
以 非 叶子 节点 的 所 有 直接 子 节点 类 别 为 输出 数据 


| /A 
获取 各 个 深度 学 习 模 型 的 输出 数据 对 应 训练 时 的 输入 数据 ， 然 后 分 别 将 各 个 
深度 学 习 模型 训练 时 的 输入 数据 和 对 应 的 输出 数据 作为 对 应 深度 学 习 模型 的 
输入 和 预期 输出 ， 对 深度 学 习 模 型 进行 训练 


图 1-1 基于 类 别 树 的 深度 学 习 方法 流程 图 


(1) 步 又 S1, 获 取 训 练 数据 中 输出 数据 对 应 的 类 别 树 。 其 中 ,获取 类 别 树 的 方式 可 以 
是 自动 构建 。 

例如 ,一 个 技术 方案 的 类 别 树 如 图 1-2 所 示 。 输 出 数据 包括 但 不 限于 输出 标签 。 当 训 
练 数据 中 输出 数据 包括 输出 标签 " 猪 “ 狗 “ 草 ”“ 树 ”“ 藻 ”男人 ”“ 女 人 ”时 ,这 些 输 出 数据 对 
应 图 1-2 中 类 别 树 的 叶子 节点 。 例 如 ,类 别 树 中 生物 类 别 对 应 的 训练 数据 中 输出 标签 为 “ 生 
物 ”; 类 别 树 中 动物 类 别 对 应 的 训练 数据 中 输出 标签 为 “动物 ”。 

在 自动 构建 类 别 树 时 ,可 以 对 训练 数据 中 的 输出 数据 进行 语义 分 析 , 获 得 对 应 的 类 别 
树 。 具 体 步 又 为 : 获取 输出 标签 集合 ,将 输出 标签 集合 中 每 个 输出 标签 作为 一 个 叶子 节 
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图 1-2 类 别 树 的 示意 图 


点 ; 加 从 标签 分 类 知识 库 中 获取 输出 标签 集合 中 每 个 输出 标签 所 属 的 父 类 标签 ; OE 
同一 个 父 类 标签 的 各 输出 标签 作为 该 父 类 标签 的 子 类 ,并 将 该 父 类 标签 作为 属于 该 父 类 标 
签 的 各 输出 标签 的 父 节点 ; @ 将 父 类 标签 加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 
标签 从 输出 标签 集合 中 删 去 ,并 返回 步骤 @) ,直至 输出 标签 集合 中 只 剩 一 个 输出 标签 ; @ 将 
剩余 的 输出 标签 作为 类 别 树 的 根 节点 。 

标签 分 类 知识 库 是 事先 构建 好 的 。 

标签 分 类 知识 库 中 包括 输出 标签 及 其 所 属 的 父 类 标签 。 例 如 ,输出 标签 "男人 ”女人 ” 
属于 父 类 标签 “人 ”的 子 类 ; 输出 标签 “ 猪 “ 狗 ”属于 父 类 标签 “动物 ”的 子 类 ; 输出 标签 “ 草 ” 
“ 树 “ 藻 ”属于 父 类 标签 “植物 ”的 子 类 。 

标签 分 类 知识 库 包括 能 区 分 父 类 标签 的 所 有 直接 子 类 标签 的 特征 变量 集合 。 例 如 ,能 
区 分 父 类 标签 “植物 ”的 所 有 直接 子 类 标签 " 草 “ 树 “ 藻 ” 类 别 的 特征 变量 集合 中 包括 特征 变 
量 “ 高 度 及 颜色 及 纹理 ”; 能 区 分 父 类 标签 "人 ”的 所 有 直接 子 类 标签 "男人 ”女人 ?类别 的 特 
征 变量 集合 中 包括 特征 变量 “胸部 “头发 ”。 

可 以 获取 输出 标签 集合 { 猪 , 狗 , 草 , 树 , 藻 , 男 人 ,女人 } ,将 输出 标签 集合 中 每 个 输出 标 
签 作为 一 个 叶子 节点 。 

然后 ,从 标签 分 类 知识 库 中 获取 输出 标签 集合 { 猪 , 狗 , 草 , 树 , 藻 , 男 人 ,女人 } 中 每 个 输 
出 标签 所 属 的 父 类 标签 ,“ 男 人 ”女人 ”属于 人 ”的 子 类 ;“ 猪 "“ 狗 ”属于 “动物 ”的 子 类 ; 
“ 草 “ 树 ”“ 藻 ”属于 “植物 ”的 子 类 。 

将 该 父 类 标签 “人 ”作为 属于 该 父 类 标签 的 各 输出 标签 “男人 ”“ 女 人 ”的 父 节点 ,将 该 父 
类 标签 "人 ”加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 标签 "男人 ”女人 ”从 输出 标签 
集合 中 删 去 ; 将 该 父 类 标签 “动物 ”作为 属于 该 父 类 标签 的 各 输出 标签 “ 猪 ”“ 狗 ”的 父 节点 ， 
将 该 父 类 标签 “动物 ”加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 标签 “ 猪 “ 狗 ”从 输出 
标签 集合 中 删 去 ; 将 该 父 类 标签 “植物 ”作为 属于 该 父 类 标签 的 各 输出 标签 “ 草 ”“ 树 ”“ 藻 ”的 
父 节 点 ,将 该 父 类 标签 “植物 ”加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 标签 “ 草 ”“ 树 ” 
“ 藻 ” 从 输出 标签 集合 中 删 去 。 得 到 新 的 输出 标签 集合 (动物 ,植物 ,人 ) ,然后 重新 从 标签 分 
类 知识 库 中 获取 输出 标签 集合 {动物 ,植物 , 人} 中 每 个 输出 标签 所 属 的 父 类 标签 , “动物 ” 
“人 ”属于 “动物 ”的 子 类 ;“ 动 物 “ 植 物 ” 属 于 “生物 ”的 子 类 .。 

将 该 父 类 标签 “动物 ”作为 属于 该 父 类 标签 的 各 输出 标签 “人 ”的 父 节点 ,将 该 父 类 标签 
“动物 ?加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 标签 ”人 ”从 输出 标签 集合 中 删 去 ,将 
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该 父 类 标签 “生物 ”作为 属于 该 父 类 标签 的 各 输出 标签 “动物 “植物 ”的 父 节点 ,将 该 父 类 标 
签 “ 生 物 ” 加 入 输出 标签 集合 ,将 属于 该 父 类 标签 的 各 输出 标签 “动物 “植物 ”从 输出 标签 集 
合 中 删 去 。 得 到 新 的 输出 标签 集合 {生物 } ,此 时 输出 标签 集合 中 只 剩 下 一 个 输出 标签 , 则 将 
该 输出 标签 {生物} 作为 类 别 树 的 根 节点 。 

(2) 步骤 S2, 根 据 类 别 树 分 别 构造 各 个 非 叶子 节点 对 应 的 深度 学 习 模 型 ,深度 学 习 模 
型 以 非 叶 子 节点 的 所 有 直接 子 节点 类 别 为 输出 数据 。 

具体 步骤 为 : 以 根 节点 为 当前 节点 ; @ 对 以 当前 节点 的 所 有 直接 子 节点 类 别 为 输出 
数据 时 输出 数据 的 格式 为 输出 格式 、 以 当前 节点 的 所 有 直接 子 节点 类 别 对 应 的 输入 数据 的 
格式 为 输入 格式 对 深度 学 习 模 型 进行 初始 化 ,得 到 当前 节点 对 应 的 深度 学 习 模 型 ; 分 别 
将 当前 节点 的 各 个 直接 子 节点 作为 当前 节点 ,并 返回 步骤 @) ,直到 当前 节点 为 叶子 节点 为 止 。 

其 中 ,直接 子 节点 指 子 节点 自身 ,不 包括 子 节点 的 子 节点 等 更 下 一 级 子 节点 。 例 如 ,在 
图 1-2 中 ,节点 “生物 ”的 直接 子 节点 为 节点 “动物 ”和 节点 “植物 ”, 节 点 “动物 ”的 直接 子 节点 
为 节点 “人 ”节点 “ 猪 " 和 节点 “ 狗 ”。 

通过 分 级 构造 深度 学 习 模型 的 方式 ,使 得 单个 深度 学 习 模型 的 输出 数据 的 类 别 数量 不 
会 过 多 ,从 而 降低 了 训练 的 复杂 性 ,提高 了 应 用 时 输出 的 准确 度 。 

仍 以 图 1-2 所 示 的 类 别 树 为 例 , 在 本 步骤 中 ,可 以 先 将 “生物 ”节点 为 当前 节点 ,当当 前 
节点 为 “生物 ”节点 时 ,“ 生 物 ” 节 点 的 所 有 直接 子 节点 包括 “动物 “植物 ”。 对 以 当前 节点 “ 生 
物 ” 的 所 有 直接 子 节点 类 别 “ 动 物 “ 植 物 ” 为 输出 数据 时 输出 数据 的 格式 为 输出 格式 、 以 当前 
节点 “生物 "的 所 有 直接 子 节点 类 别 “ 动 物 “ 植 物 ” 对 应 的 输入 数据 的 格式 为 输入 格式 对 深度 
学 习 模型 进行 初始 化 ,得 到 当前 节点 “生物 ”对 应 的 深度 学 习 模 型 。 

(3) 步骤 S3, 获 取 各 个 深度 学 习 模 型 的 输出 数据 对 应 的 训练 的 输入 数据 ,然后 分 别 将 
各 个 深度 学 习 模 型 的 训练 的 输入 数据 和 对 应 的 输出 数据 作为 对 应 深度 学 习 模型 的 输入 和 预 
期 输出 ,对 深度 学 习 模型 进行 训练 。 

有 具体 步骤 为 : 将 以 非 叶 子 节点 的 每 个 直接 子 节点 对 应 的 类 别 作为 对 应 深度 学 习 模 型 
的 训练 数据 中 的 输出 数据 ; @ 将 非 叶 子 节点 的 每 个 直接 子 节点 类 别 对 应 的 样本 数据 作为 非 
叶子 节点 对 应 的 深度 学 习 模型 的 训练 数据 时 的 初始 输入 数据 。 通 过 分 级 使 得 级 别 越 高 ( 根 
节点 的 级 别 最 低 ) 的 节点 类 别 对 应 的 训练 数据 越 少 ,从 而 提高 了 训练 的 针对 性 ,并 能 降低 训 
练 的 复杂 度 。 

例如 ,当前 节点 为 生物 ”节点 时 ,“ 生 物 ” 节 点 的 所 有 直接 子 节点 包括 “动物 “植物 ”"。 将 
以 非 叶子 节点 “生物 ”的 每 个 直接 子 节点 “动物 “植物 ”对 应 的 类 别 作 为 对 应 深度 学 习 模型 的 
训练 数据 中 的 输出 数据 ; 将 非 叶 子 节点 “生物 ”的 每 个 直接 子 节点 “动物 “植物 "类别 对 应 的 
样本 数据 作为 非 叶子 节点 “生物 ”对 应 的 深度 学 习 模 型 的 训练 数据 的 初始 输入 数据 。 此 时 训 
练 时 输入 数据 是 动物 图 像 ,对 应 的 预期 输出 是 “动物 ”标签 ; 训练 时 输入 数据 是 植物 图 像 , 对 
应 的 预期 输出 则 是 “植物 ”标签 。 

或 者 在 本 步骤 中 ,可 以 通过 标签 分 类 知识 库 获取 能 区 分 非 叶子 节点 的 各 个 直接 子 节点 
类 别 对 应 的 各 个 直接 子 类 标签 的 特征 变量 集合 ; 非 叶子 节点 对 应 父 类 标签 ; 从 初始 输入 数 
据 中 抽取 特征 变量 集合 对 应 的 输入 数据 ,作为 对 应 深度 学 习 模型 的 训练 时 的 输入 数据 。 

例如 ,当前 节点 为 生物 ”节点 时 ,“ 生 物 ” 节 点 的 所 有 直接 子 节点 包括 “动物 “植物 "。 从 
标签 分 类 知识 库 中 获取 能 区 分 当前 节点 “生物 ”的 所 有 直接 子 节点 “动物 “植物 ”类 别 的 特征 
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变量 集合 为 (颜色 及 纹理 } ,从 初始 输入 数据 动物 图 像 和 植物 图 像 中 抽取 特征 变量 集合 {颜色 
及 纹理 } 对 应 的 输入 数据 动物 图 像 和 植物 图 像 , 作 为 当前 节点 “生物 ”的 深度 学 习 模 型 的 训练 
时 的 输入 数据 。 

若 标签 分 类 知识 库 不 包括 能 区 分 非 叶子 节点 的 各 个 直接 子 节点 类 别 对 应 的 各 个 直接 子 
类 标签 的 特征 变量 集合 , 则 对 属于 非 叶子 节点 的 不 同 子 节点 类 别 的 样本 数据 中 各 特征 变量 
的 数值 进行 比较 ; 从 各 特征 变量 中 选 出 在 不 同 子 节点 类 别 对 应 的 样本 数据 中 数值 差异 大 于 
预 设 阔 值 的 特征 变量 集合 ,作为 能 区 分 当前 节点 的 所 有 子 节点 类 别 的 特征 变量 集合 。 本 技 
术 方 案 中 的 差异 是 指 特征 变量 的 数值 的 差别 ,例如 ,“ 草 "头像 的 特征 ,包括 颜色 特征 、 纹 理 特 
征 等 。 

例如 ,当前 节点 为 “生物 ”节点 时 ,“ 生 物 ” 节 点 的 所 有 直接 子 节点 包括 "动物 “植物 ”"。 对 
属于 当前 节点 “生物 ”的 所 有 直接 子 节点 “动物 “植物 "类别 的 输入 数据 动物 图 像 和 植物 图 像 
进行 比较 ,从 中 选 出 在 不 同 子 节点 类 别 *“ 动 物 “ 植 物 ”的 样本 数据 动物 图 像 和 植物 图 像 中 各 
特征 变量 的 数值 进行 比较 ,从 各 特征 变量 中 选 出 在 不 同 子 节点 类 别 “ 动 物 “ 植 物 " 对 应 的 样 
本 数据 动物 图 像 和 植物 图 像 中 数值 差异 大 于 预 设 阔 值 的 特征 变量 集合 为 { 颜 色 及 纹理 ), 作 
为 能 区 分 当前 节点 “生物 ”的 所 有 子 节点 类 别 “ 动 物 “ 植 物 ” 的 特征 变量 集合 。 

在 对 当前 节点 对 应 的 深度 学 习 模 型 进行 训练 时 , 先 利用 训练 数据 中 的 输入 数据 对 当前 
节点 对 应 的 深度 学 习 模 型 进行 无 监督 训练 ,再 利用 训练 数据 中 的 输入 数据 和 对 应 的 输出 数 
据 对 当前 节点 对 应 的 深度 学 习 模 型 进行 有 监督 训练 。 

例如 ,当前 节点 为 “生物 ”节点 时 ,将 当前 节点 “生物 ”对 应 的 深度 学 习 模 型 的 训练 时 的 输 
人 数据 动物 图 像 和 植物 图 像 以 及 输出 数据 “动物 ”标签 “植物 ”标签 分 别 作 为 当前 节点 对 应 
的 深度 学 习 模 型 的 输入 和 预期 输出 ,对 当前 节点 对 应 的 深度 学 习 模 型 进行 训练 。 或 将 当前 
节点 “生物 ”对 应 的 深度 学 习 模 型 的 训练 时 的 输入 数据 动物 图 像 颜 色 及 纹理 和 植物 图 像 颜色 
及 纹理 和 输出 数据 “动物 "标签 “植物 ”标签 分 别 作 为 当前 节点 对 应 的 深度 学 习 模 型 的 输入 
和 预期 输出 ,对 当前 节点 “生物 ”对 应 的 深度 学 习 模 型 进行 训练 。 

上 述 训练 过 程 从 根 节点 开始 ,以 根 节点 为 当前 节点 ,对 当前 节点 对 应 的 深度 学 习 模型 进 
行 训 练 ,然后 以 根 节点 的 各 个 直接 子 节点 为 当前 节点 ,对 当前 节点 对 应 的 深度 学 习 模 型 进行 
训练 ; 重复 上 述 过 程 ,直到 当前 节点 为 叶子 节点 为 止 。 

例如 ,当前 节点 为 生物 ”节点 时 ,“ 生 物 ” 节 点 的 所 有 直接 子 节点 包括 “动物 “植物 ”, 分 
别 以 当前 节点 “生物 ”的 每 一 个 直接 子 节点 “动物 “植物 ”作为 当前 节点 重复 上 述 训 练 过 程 ， 
直至 当前 节点 为 叶子 节点 为 止 。 

2, 基于 类 别 树 的 深度 学 习 的 详细 方法 

在 一 个 技术 方案 中 ,训练 出 深度 学 习 模型 之 后 ,本 技术 方案 包括 以 下 步骤 : 中 获取 使 用 
时 的 输入 数据 ; 如 以 根 节点 作为 当前 节点 ,以 1 作为 当前 级 别 , 获 取 当 前 节点 对 应 的 深度 学 
习 模 型 ; 四 获取 使 用 时 的 输入 数据 对 应 于 当前 节点 的 深度 学 习 模 型 的 输出 数据 ; @ 如 果 深 
度 学 习 得 到 的 输出 数据 的 类 别 不 是 空 标签 , 则 继续 执行 以 下 两 个 步骤 (如 果 深 度 学 习 得 到 的 
输出 数据 的 类 别 是 空 标签 , 则 不 再 执行 以 下 两 个 步 又) : a. 将 该 类 别 作为 使 用 时 的 输入 数据 
在 当前 级 别 上 所 属 的 类 别 并 输出 ,并 且 根据 深度 学 习 得 到 的 输出 数据 的 类 别 从 类 别 树 中 选 
择 该 类 别 对 应 的 节点 ; b. 以 选择 的 节点 作为 当前 节点 ,将 当前 级 别 加 1, 并 返回 步骤 四 , 直 
到 当前 节点 为 叶子 节点 为 止 。 
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其 中 ,获取 使 用 时 的 输入 数据 对 应 于 当前 节点 的 深度 学 习 模型 的 输出 数据 的 步骤 包括 : 
将 使 用 时 的 输入 数据 作为 当前 节点 对 应 的 深度 学 习 模 型 的 输入 数据 ,通过 深度 学 习 得 到 输 
出 数据 ; 或 者 获取 能 区 分 当前 节点 的 所 有 直接 子 节点 类 别 的 输入 数据 变量 集合 ; 将 获取 的 
输入 数据 变量 集合 对 应 的 输入 数据 作为 当前 节点 对 应 的 深度 学 习 模型 的 输入 数据 ,通过 深 
度 学 习 得 到 输出 数据 。 

使 用 深度 学 习 得 到 的 输出 数据 的 类 别 作为 使 用 时 的 输入 数据 在 当前 级 别 上 所 属 的 类 别 
并 输出 ,使 用 时 能 够 获得 多 个 级 别 的 类 别 ( 对 应 于 各 级 非 叶 子 节点 和 叶子 节点 ), 相 对 于 现 有 
技术 使 用 时 只 能 输出 一 个 级 别 的 类 别 ( 对 应 于 叶子 节点 ) 而 言 , 输 出 结果 更 为 丰富 。 例 如 ,使 
用 时 输入 数据 为 图 像 A 在 第 1 级 别 上 所 属 的 类 别 为 “生物 ”, 在 第 1 级 别 上 所 属 的 类 别 为 
“生物 ”, 在 第 2 级 别 上 所 属 的 类 别 为 “动物 ”, 在 第 3 级 别 上 所 属 的 类 别 为 “人”, 在 第 4 级别 
上 所 属 的 类 别 为 “男人 ”。 

例如 ,可 以 获取 使 用 时 的 输入 数据 为 图 像 A, 初 始 时 以 根 节点 “生物 ”作为 当前 节点 。 当 
前 节点 为 生物 ”节点 时 ,获取 当前 节点 “生物 ”对 应 的 深度 学 习 模型 。 

当前 节点 为 “生物 ”节点 时 ,将 输入 数据 图 像 A 作为 当前 节点 “生物 ”对 应 的 深度 学 习 模 
型 的 输入 数据 ,通过 深度 学 习 得 到 的 输出 数据 “动物 ?标签 或 “植物 ”标签 或 空 标签 ,如果 通过 
深度 学 习 得 到 输出 数据 不 是 空 标签 , 则 将 “动物 类别 或 "植物 ”类别 作 为 使 用 时 的 输入 数据 
图 像 A 在 当前 级 别 上 所 属 的 类 别 并 输出 ,并 且 根 据 深度 学 习 得 到 的 输出 数据 的 “动物 ?类别 
或 "植物 类别 从 类 别 树 中 选择 该 动物 ?类 别 或 "植物 ”类别 对 应 的 节点 ,以 选择 的 “动物 ”类 
别 或 "植物 ?类 别 作为 当前 节点 ,将 当前 级 别 加 1。 

或 者 ,当前 节点 为 "生物 ?节点 时 ,获取 能 区 分 当前 节点 的 所 有 直接 子 节点 类 别 " 动 物 ” 
“植物 ”的 输入 数据 变量 集合 {颜色 及 纹理 } 对 应 的 输入 数据 图 像 A 颜色 及 纹理 作为 当前 节 
点 “生物 ”对 应 的 深度 学 习 模 型 的 输入 数据 ,通过 深度 学 习 得 到 输出 数据 “动物 "标签 或 “ 植 
物 ” 标 签 或 空 标签 ,如 果 通过 深度 学 习 得 到 输出 数据 不 是 空 标签 , 则 将 “动物 ”类别 或 “植物 ” 
类 别 作为 使 用 时 输入 数据 图 像 A 在 当前 级 别 上 所 属 的 类 别 并 输出 ,并 且 根 据 深 度 学习 得 到 
的 输出 数据 的 "动物 ?类 别 或 “植物 ”类 别 从 类 别 树 中 选择 该 动物? 类别 或 植物” 类别 对 应 的 
节点 ,以 选择 的 “动物 ”类 别 或 “植物 ”类 别 作 为 当前 节点 ,将 当前 级 别 加 1。 

本 技术 方案 根据 深度 学 习 得 到 的 输出 数据 的 类 别 来 从 类 别 树 中 选择 该 类 别 对 应 的 节 
点 ,然后 以 该 节点 为 当前 节点 重复 上 述 深度 学 习 过 程 ,直至 当前 节点 为 叶子 节点 为 止 。 

例如 ,当当 前 节点 为 "生物 ”节点 ,深度 学 习 得 到 的 输出 数据 的 类 别 为 "动物 ”标签 时 ,以 
类 别 树 中 “动物 ”节点 为 当前 节点 重复 上 述 深度 学 习 过 程 , 直 至 当前 节点 为 叶子 节点 为 止 。 

深度 学 习 得 到 的 输出 数据 的 类 别 为 植物 ”标签 时 ,以 类 别 树 中 “植物 ”节点 为 当前 节点 
重复 上 述 深度 学 习 过 程 ,直至 当前 节点 为 叶子 节点 或 深度 学 习 得 到 的 输出 数据 是 空 标签 
为 止 。 

当当 前 节点 为 “动物 ”节点 ,深度 学 习 得 到 的 输出 数据 的 类 别 为 "人 ?标签 时 ,以 类 别 树 中 
“人 ?节点 为 当前 节点 重复 上 述 深度 学 习 过 程 , 直 至 当前 节点 为 叶子 节点 为 止 。 

深度 学 习 得 到 的 输出 数据 的 类 别 为 “ 猪 ”标签 时 ,以 类 别 树 中 “ 猪 ” 节 点 为 当前 节点 ,当前 
节点 “ 猪 ”为 叶子 节点 , 则 停止 重复 上 述 深 度 学 习 过 程 。 

深度 学 习 得 到 的 输出 数据 是 空 标签 时 ,停止 重复 上 述 深度 学 习 过 程 。 

本 技术 方案 还 可 以 获取 使 用 时 输入 数据 对 应 的 预期 输出 数据 ; 如 果 预 期 输出 数据 与 输 
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和 人 数据 经 深度 学 习 模型 后 得 到 的 输出 数据 不 一 致 ,以 使 用 时 输入 数据 和 预期 输出 数据 作为 
训练 数据 ,进一步 地 对 各 个 深度 学 习 模 型 进行 训练 。 

例如 ,获取 输入 数据 图 像 A 在 现实 中 对 应 的 输出 数据 为 女人”, 该 输入 数据 图 像 A 输 
和 人 深度 学 习 模 型 后 通过 深度 学 习 得 到 的 输出 数据 为 男人 ”, 则 以 输入 数据 图 像 A 及 真实 输 
出 数据 "女人 ”来 作为 训练 数据 对 现 有 各 深度 学 习 模 型 采用 上 述 同样 方法 进行 训练 。 

上 述 基于 类 别 树 的 深度 学 习 方 法 ,通过 多 级 深度 学 习 模 型 逐 层 训练 和 逐 层 应 用 ,降低 了 
输入 项 数 和 输出 类 别 数 ,从 而 降低 了 各 级 深度 学 习 模 型 的 结构 复杂 性 及 训练 和 应 用 难度 , 降 
低 了 深度 学 习 模 型 的 计算 复杂 度 , 提 高 了 深度 学 习 模 型 的 准确 率 。 同 时 ,使 用 深度 学 习 得 到 
的 输出 数据 的 类 别 作 为 使 用 时 输入 数据 在 当前 级 别 上 所 属 的 类 别 并 输出 ,能 够 获得 多 个 级 
别 的 类 别 (对 应 于 各 级 非 叶 子 节点 和 叶子 节点 ), 相 对 于 现 有 技术 使 用 时 只 能 输出 一 个 级 别 
的 类 别 ( 对 应 于 叶子 节点 ) 而 言 ,输出 结果 更 为 丰富 。 


1.1.2 基于 类 别 树 的 深度 学 习 系 统 


如 图 1-3 所 示 ,本 技术 还 提供 一 种 深度 学 习 系统 ,可 包括 ， 

(1) 获取 模块 1 用 于 获取 训练 数据 中 输出 数据 对 应 的 类 别 树 。 

(2) 构造 模块 2 用 于 根据 类 别 树 分 别 构造 各 个 非 叶子 节点 对 应 的 深度 学 习 模 型 ,深度 
学 习 模 型 以 非 叶子 节点 的 所 有 直接 子 节点 类 别 为 输出 数据 。 

(3) 训练 模块 3 用 于 获取 各 个 深度 学 习 模 型 的 输出 数据 对 应 
的 训练 时 输入 数据 ,然后 分 别 将 各 个 深度 学 习 模 型 的 训练 时 输入 
数据 和 对 应 的 输出 数据 作为 对 应 深度 学 习 模 型 的 输入 和 预期 输 
出 ,对 深度 学 习 模型 进行 训练 。 

上 述 深度 学 习 系 统 , 通 过 多 级 深度 学 习 模 型 逐 层 训练 和 逐 层 
应 用 ,降低 了 输入 项 数 和 输出 类 别 数 ,从 而 降低 了 各 级 深度 学 习 模型 的 结构 复杂 性 及 训练 和 
应 用 难度 ,降低 了 深度 学 习 模 型 的 计算 复杂 度 ,提高 了 深度 学 习 模 型 的 准确 率 。 同 时 ,使 用 
深度 学 习 得 到 的 输出 数据 的 类 别 作为 使 用 时 输入 数据 在 当前 级 别 上 所 属 的 类 别 并 输出 ,能 
够 获得 多 个 级 别 的 类 别 ( 对 应 于 各 级 非 叶子 节点 和 叶子 节点 ), 相 对 于 现 有 技术 使 用 时 只 能 
输出 一 个 级 别 的 类 别 ( 对 应 于 叶子 节点 ) 而 言 , 输 出 结果 更 为 丰富 。 


图 1-3 深度 学 习 系 统 的 
结构 示意 图 


1.2 基于 联合 聚 类 深度 学 习 模 型 的 数据 识别 


现 有 深度 学 习 模 型 能 通过 输入 数据 得 到 输出 标签 ,例如 ,通过 头像 得 到 该 人 身份 证 号 ， 
或 者 通过 语音 得 到 该 人 身份 证 号 。 但 在 自 顶 向 下 的 监督 学 习 阶 段 必须 要 通过 带 标签 数据 的 
监督 学 习 , 例 如 , 带 有 身份 证 号 的 头像 ,或 者 带 有 身份 证 号 的 语音 。 如 果 同 时 具备 带 有 身份 
证 号 的 头像 和 带 有 身份 证 号 的 语音 , 则 可 以 将 一 个 头像 输入 头像 类 对 应 的 深度 学 习 模 型 ,从 
而 得 到 输出 的 身份 证 号 。 将 一 个 语音 输入 语音 类 对 应 的 深度 学 习 模 型 得 到 输出 的 身份 证 


Bi 8 数据 处 理 与 深度 学 习 | 


号 ,然后 判断 通过 输入 头像 和 输入 语音 分 别 得 到 的 输出 的 身份 证 号 是 否 相 同 。 如 果 相 同 则 
判断 一 个 头像 与 一 个 语音 对 应 的 是 同一 人 ,如 果 不 同 则 判断 一 个 头像 与 一 个 语音 对 应 的 不 
是 同一 人 。 

但 是 ,由 于 深度 学 习 模 型 的 准确 率 无 法 达到 100 6°) ,所 以 一 个 头像 输入 头像 类 对 应 
的 深度 学 习 模 型 后 输出 的 身份 证 号 可 能 是 另 一 个 头像 相似 的 人 的 身份 证 号 ,一 个 语音 输入 
语音 类 对 应 的 深度 学 习 模 型 后 输出 的 身份 证 号 可 能 是 另 一 个 语音 相似 的 人 的 身份 证 号 , 那 
么 就 会 导致 不 属于 同一 个 人 的 一 个 头像 和 一 个 语音 被 判定 为 对 应 同一 个 人 ,也 会 导致 属于 
不 同人 的 一 个 头像 和 一 个 语音 被 判定 为 对 应 同一 个 人 。 当 判断 出 一 个 头像 和 一 个 语音 对 应 
不 同人 时 , 却 无 法 计算 出 该 头像 和 该 语音 可 能 对 应 同一 个 人 的 概率 ; 或 者 当 判 断 出 一 个 头 
像 和 一 个 语音 对 应 同一 个 人 时 , 却 无 法 计算 出 该 头像 和 该 语音 可 能 对 应 不 同人 的 概率 或 其 
他 人 的 概率 。 

当 通 过 语音 ,头像 ,甚至 更 多 其 他 类 型 的 数据 来 识别 对 象 时 ,使 用 现 有 深度 学 习 技术 ,无 
法 综合 利用 相似 度 及 多 种 深度 学 习 的 结果 来 计算 出 其 他 可 能 性 输出 及 最 优 输出 ,从 而 无 法 
进行 进一步 的 精准 识别 和 判断 。 

本 技术 方案 研究 并 给 出 了 一 种 新 的 基于 联合 聚 类 深度 学 习 模 型 的 数据 识别 方法 ,步骤 
如 下 : 中 获取 N 类 数据 样本 集 及 对 应 的 标签 集 并 进行 预 处 理 , 同 时 获取 数据 预 设 格 式 、 标 
签 预 设 格式 ; 四 对 深度 学 习 模型 进行 训练 ; @@ 将 每 一 类 任 一 测试 数据 转化 为 该 类 数据 预 设 
格式 后 作为 该 类 深度 学 习 模型 的 输入 ,得 到 对 应 的 测试 输出 标签 ; 田 根据 测试 输出 标签 所 
在 标签 集 的 元 素 个 数 及 数据 集 之 间 相 似 度 的 计算 ,确定 可 能 输出 标签 及 最 优 输出 标签 ; OTP 
算 各 类 输出 标签 一 致 和 不 一 致 的 概率 ; @ 将 可 能 、 最 优 输出 标签 及 步骤 @ 中 的 概率 输出 。 

本 技术 方案 通过 相似 度 计算 弥补 深度 学 习 模 型 在 输出 标签 数量 多 而 输入 样本 量 不 足 时 
输出 准确 性 的 不 足 , 进 而 提高 输出 的 准确 性 。 


1.2.1 基于 联合 聚 类 深度 学 习 模型 的 数据 识别 方法 


1. 基于 联合 聚 类 深度 学 习 模 型 的 N 类 数据 识别 

基于 联合 聚 类 深度 学 习 模 型 的 数据 识别 方法 ,包括 以 下 步 又。 

(1) 步骤 S1, 先 获取 N 类 数据 样本 集 及 每 一 类 数据 样本 集 对 应 的 标签 集 , 再 获取 N 类 
数据 样本 集中 每 一 类 数据 样本 的 数据 预 设 格式 ,并 获取 标签 预 设 格式 ,然后 对 N 类 数据 样 
本 集 和 标签 集 进行 预 处 理 ; N 三 1。 其 中 ,获取 N 类 中 每 一 类 数据 样本 的 数据 预 设 格式 ,并 
获取 标签 预 设 格式 ,具体 步骤 为 : 

获取 每 一 类 数据 样本 集中 每 一 个 数据 样本 的 数据 格式 ,将 该 类 中 相同 的 数据 格式 进行 
合并 得 到 ; 种 数据 格式 ,统计 该 类 数据 样本 集中 每 一 种 数据 格式 P; 对 应 的 数据 样本 数量 
Mi ,将 最 大 的 M; 对 应 的 数据 格式 P; 作为 该 类 数据 样本 的 数据 预 设 格式 ; 其 中 ,s 宇 1,i 宇 1 
Ais, 

获取 每 一 类 数据 样本 集 对 应 的 标签 集中 每 一 个 标签 的 标签 格式 ,将 所 有 类 中 相同 的 标 
签 格 式 进行 合并 得 到 至 少 t 种 标签 格式 ,统计 该 类 标签 集中 每 一 种 标签 格式 Qi 对 应 的 标签 
数量 Ni ,将 最 大 的 Ni 对 应 的 标签 格式 Qi 作为 标签 预 设 格式 ; Hel. j 宇 1 A j<1。 
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对 N 类 数据 样本 集 和 标签 集 进行 预 处 理 ,具体 步骤 如 下 。 

步骤 S1-1, 判 断 每 一 类 数据 样本 集中 每 一 数据 样本 的 数据 格式 是 否 与 该 类 数据 样本 的 
数据 预 设 格式 一 致 ,如 果 不 一 致 , 则 将 该 类 数据 样本 的 数据 格式 转化 为 该 类 数据 样本 的 数据 
预 设 格式 ; 

步骤 S1-2 ,判断 每 一 类 数据 样本 集中 每 一 个 数据 样本 对 应 的 标签 的 数据 格式 是 否 与 标 
签 预 设 格式 一 致 ,如 果 不 一 致 , 则 将 该 类 数据 样本 对 应 的 标签 的 数据 格式 转化 为 标签 预 设 
格式 ; 

步骤 S1-3, 对 N 类 数据 样本 集中 的 每 类 数据 样本 集 进 行 聚 类 处 理 ,获得 j 个 聚 类 后 的 
数据 样本 集 及 其 对 应 的 输出 标签 集 ; 

步骤 S1-4, 对 J 个 聚 类 后 的 输出 标签 集中 每 个 类 中 相同 的 标签 进行 合并 ,得 到 更 新 后 
的 J 个 输出 标签 集 ; 

步骤 S1-5 ,将 更 新 后 的 个 输出 标签 集中 具有 相同 标签 的 标签 集 及 对 应 的 数据 样本 集 
分 别 进行 合并 ,得 到 预 处 理 后 的 数据 样本 集 及 其 对 应 的 输出 标签 集 。 

(2) 步骤 S2, 初 始 化 N 类 数据 样本 集 对 应 的 N 个 深度 学 习 模型 。 具 体 为 : 

步骤 S2-1, 将 每 一 类 数据 样本 的 数据 预 设 格式 作为 该 类 对 应 的 深度 学 习 模 型 的 输入 
格式 ; 

步 又 S2-2, 将 标签 预 设 格式 作为 每 一 类 对 应 的 深度 学 习 模 型 的 输出 格式 ; 

步骤 S2-3 ,获取 每 一 类 对 应 的 深度 学 习 模 型 的 配置 信息 ,将 其 作为 该 类 对 应 的 深度 学 
习 模 型 的 配置 信息 ,然后 对 该 类 对 应 的 深度 学 习 模 型 进行 配置 。 具 体 为 ， 

CD, 从 深度 学 习 模 型 配置 知识 库 中 获取 输入 格式 、 输 出 格式 与 每 一 类 数据 预 设 格式 及 标 
签 预 设 格式 最 为 匹配 的 深度 学 习 模 型 对 应 的 配置 信息 ,将 其 作为 该 类 对 应 的 深度 学 习 模型 
的 预 设 配置 信息 。 

其 中 ， 


输入 格式 .输出 格式 与 每 类 数据 预 设 格式 及 标签 预 设 格式 的 匹配 度 
= 输入 格式 与 该 类 数据 预 设 格式 的 匹配 度 X % 十 
输出 格式 与 标签 预 设 格式 的 匹配 度 X (1 — 
u 的 默认 值 为 90。 
@ 将 每 一 类 对 应 的 深度 学 习 模型 的 预 设 配置 信息 输出 给 用 户 。 
@ 获取 用 户 对 每 一 类 对 应 的 深度 学 习 模型 的 预 设 配 置信 息 的 修改 。 
D 将 修改 后 的 每 一 类 对 应 的 深度 学 习 模 型 的 预 设 配置 信息 ,作为 该 类 对 应 的 深度 学 习 
模型 的 预 设 配置 信息 
(3) 步骤 S3， HbR S1 获取 的 每 一 类 数据 样本 集 作为 输入 ,将 其 对 应 的 标签 集 作为 输 
出 ,对 该 类 对 应 的 深度 学 习 模型 进行 训练 ,得 到 N 个 训练 后 的 深度 学 习 模 型 。 具 体 为 ; 
步骤 S3-1 ,将 每 一 类 数据 样本 集中 每 一 个 数据 样本 作为 该 类 对 应 的 深度 学 习 模 型 的 输 
入 ,对 该 类 对 应 的 深度 学 习 模型 进行 自 下 而 上 的 无 监督 训练 。 
步骤 S3-2 ,将 每 一 类 数据 样本 集中 每 一 个 数据 样本 作为 该 类 对 应 的 深度 学 习 模 型 的 输 
入 ,将 该 类 数据 样本 集 对 应 的 标签 集中 该 数据 样本 对 应 的 标签 作为 输出 ,对 该 类 对 应 的 深度 
学 习 模型 进行 自 顶 向 下 的 监督 学 习 , 得 到 N 个 训练 后 的 深度 学 习 模型 。 
(A) 步骤 S4 ,为 每 一 类 对 应 的 深度 学 习 模 型 获取 一 个 测试 数据 ,将 每 一 类 测试 数据 的 
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数据 格式 转化 为 该 类 数据 样本 的 数据 预 设 格式 ,然后 将 该 测试 数据 作为 该 类 对 应 的 深度 学 
习 模 型 的 输入 ,通过 该 深度 学 习 模型 的 计算 得 到 该 类 对 应 的 测试 输出 标签 。 

(5) 步骤 S5 ,在 步骤 Sl 预 处 理 的 标签 集中 查找 每 一 类 的 测试 输出 标签 所 在 的 标签 
集 , 之 后 判断 该 标签 集 是 否 只 有 一 个 标签 元 素 。 如 果 每 一 类 的 测试 输出 标签 所 在 的 标签 
集 只 有 一 个 标签 元 素 , 则 将 每 一 类 的 测试 输出 标签 作为 该 类 的 最 优 输出 标签 ; 否则 执行 
2. 

(6) 步骤 S6 ,计算 每 一 类 的 测试 输出 标签 所 对 应 的 数据 样本 集 与 该 类 测试 输出 标签 所 
在 的 标签 集中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 , 并 根据 该 相似 度 计 算 并 确定 每 一 
组 可 能 输出 标签 ; 其 中 ,每 一 组 可 能 输出 标签 中 包含 了 每 一 类 的 一 个 可 能 输出 标签 。 具 
体 为 : 

如 果 N=1, 则 计算 测试 输出 标签 所 对 应 的 数据 样本 集 与 测试 输出 标签 所 在 的 标签 集 
中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 ,将 相似 度 大 于 第 一 预 设 值 a 的 所 有 标签 元 素 
作为 一 组 可 能 输出 标签 ; 

如 果 N 二 1, 则 获取 第 i 类 测试 输出 标签 所 对 应 的 数据 样本 集 D;; 获取 第 i 类 测试 输出 
标签 所 在 的 标签 集中 标签 元 素 的 个 数 m;; 获取 第 i 类 测试 输出 标签 所 在 的 标签 集中 第 j 个 
标签 元 素 对 应 的 数据 样本 集 D;; 计算 D; 与 D; 的 相似 度 P; ,其 中 ,i 取 从 1 一 N 中 的 每 一 
个 自然 数 ,) 取 从 1 一 m; 中 的 每 一 个 自然 数 。 

对 ki ,ks，… ,kn 的 每 一 个 取 值 ,计算 相似 度 第 一 综合 值 f (Pins Poros ***, Prew ) ,如 果 
S (Pins Prgs tts Pm ) 大 于 第 二 预 设 值 b, 则 将 第 1 类 测试 输出 标签 所 在 的 标签 集中 第 ky 
个 标签 元 素 ,第 2 类 测试 输出 标签 所 在 的 标签 集中 第 he 个 标签 元 素 ,…… :第 N 类 测试 输 


出 标签 所 在 的 标签 集中 第 kw 个 标签 元 素 , 作 为 一 组 可 能 输出 标签 ; 其 中 ,ki 取 从 1 一 ma 中 
的 每 一 个 自然 数 ,ks 取 从 1 一 ma 中 的 每 一 个 自然 数 ，…… + ky 取 从 1 一 mn 中 的 每 一 个 自然 
数 ; f Pin, Pos ** + Prawn) BAK (Pins Pos t+ Pun) FEA. 


(7) 步骤 S7, 计 算 每 一 组 可 能 输出 标签 中 每 一 类 的 可 能 输出 标签 对 应 的 数据 样本 集 与 
该 类 测试 数据 集 的 相似 度 , 并 根据 该 相似 度 计算 并 确定 一 组 可 能 输出 标签 作为 最 优 输出 标 
签 。 具 体 为 : 

如 果 N=1, 则 计算 每 一 组 可 能 输出 标签 对 应 的 数据 样本 集 与 该 类 测试 数据 集 的 相似 
度 ,获取 最 大 相似 度 对 应 的 一 组 可 能 输出 标签 作为 最 优 和 输出 标签 ; 

如 果 N 二 1, 则 计算 每 一 组 可 能 输出 标签 中 第 i 类 可 能 输出 标签 对 应 的 数据 样本 集 与 该 
类 测试 数据 集 的 相似 度 已 ,, 之 后 计算 相似 度 第 二 综合 值 gsC(P, . Pow oe) Pr) ,获取 最 大 相似 
度 第 二 综合 值 对 应 的 一 组 可 能 输出 标签 作为 最 优 输出 标签 ; 其 中 ,g(P，P;,…，, Py) AB 
RCP, Pos os Py) FET IR I~N 中 的 每 一 个 自然 数 。 

(8) 步骤 S8, 计 算 可 能 输出 标签 中 各 类 输出 标签 都 一 致 及 不 一 致 的 概率 ,作为 各 类 输 
出 标签 一 致 及 不 一 致 的 概率 。 具 体 为 : 

如 果 N=1. 则 只 有 一 类 输出 标签 ,因此 各 类 输出 标签 一 致 的 概率 为 100% ,不 一 致 的 概 
率 为 0; 

如 果 N 二 1, 则 先 判 断 每 一 组 可 能 输出 标签 中 各 类 可 能 输出 标签 是 否 一 致 ; 然后 将 判断 

结果 为 一 致 的 各 组 可 能 输出 标签 对 应 的 相似 度 第 二 综合 值 之 和 与 所 有 可 能 输出 标签 对 应 的 

相似 度 第 二 综合 值 之 和 相 除 ,得 到 各 类 输出 标签 一 致 的 概率 ; 最 后 以 100% 减 去 各 类 输出 标 
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签 一 致 的 概率 得 到 各 类 输出 标签 不 一 致 的 概率 。 

(9) 将 可 能 输出 标签 .最 优 输 出 标签 .各 类 输出 标签 一 致 及 不 一 致 的 概率 输出 。 

本 技术 方案 与 现 有 技术 相 比 ,其 显著 优点 为 : 本 技术 方案 将 深度 学 习 模型 与 相似 度 计 
算 进行 有 机 结合 ,丰富 了 输出 的 结果 ,提高 了 输出 的 准确 率 。 本 技术 方案 采用 结合 相似 度 计 
算 的 方法 ,取长补短 ,从 而 通过 相似 度 计算 来 弥补 深度 学 习 模型 在 输出 标签 数量 多 而 输入 样 
本 量 不 足 时 输出 准确 性 的 不 足 , 进 而 提高 输出 的 准确 性 。 

以 两 类 数据 样本 集 及 其 对 应 的 标签 集 为 例 。 第 一 类 数据 样本 集 为 {头像 11 ,头像 12,……， 
头像 1m) ,对 应 的 第 一 类 输出 标签 的 集合 为 {身份 证 号 11, 身 份 证 号 12,…… ,身份 证 号 
Lin} ,其 中 ,头像 11 与 身份 证 号 11 对 应 ,头像 12 与 身份 证 号 12 对 应 ，…… ,头像 1m 与 身份 
证 号 Im 对应。 其 中 可 能 会 存在 相同 的 身份 证 号 ,例如 身份 证 号 13 与 身份 证 号 16 相同 。 
第 二 类 数据 样本 集 为 {语音 21, 语 音 22,…… ,语音 2n) ,对 应 的 第 一 类 输出 标签 的 集合 为 
{身份 证 号 21, 身 份 证 号 22,…… ,身份 证 号 2n} ,其 中 ,语音 21 与 身份 证 号 21 对 应 ,语音 22 
与 身份 证 号 22 对 应 ,……: ,语音 2n 与 身份 证 号 2n 对 应 。 其 中 可 能 会 存在 相同 的 身份 证 号 ， 
例如 身份 证 号 22 与 身份 证 号 28 相同 。 

2. 基于 联合 聚 类 深度 学 习 模 型 的 两 类 数据 识别 

下 面 以 两 类 数据 样本 集 为 特例 ,结合 图 1-4 进行 说 明 。 本 技术 方案 基于 联合 聚 类 深度 
学 习 模 型 的 数据 识别 方法 ,包括 以 下 步骤 。 

(1) 步骤 S1 ,首先 获取 两 类 数据 样本 集 及 每 类 数据 样本 集 对 应 的 标签 集 , 再 获取 两 类 
数据 样本 集中 每 一 类 数据 样本 的 数据 预 设 格式 ,并 获取 标签 预 设 格式 。 具 体 为 : 

获取 每 一 类 数据 样本 集中 每 一 个 数据 样本 的 数据 格式 ,将 该 类 中 相同 的 数据 格式 进行 
合并 得 到 ; 种 数据 格式 ,统计 该 类 数据 样本 集中 每 一 种 数据 格式 已 对 应 的 数据 样本 数量 
Mi ,将 最 大 的 M; 对 应 的 数据 格式 已 , 作为 该 类 数据 样本 的 数据 预 设 格式 ; 其 中 ,三 1 二 1 
且 i 三 ;。 例 如 ,第 1 类 数据 样本 为 图 像样 本 ,第 2 类 数据 样本 为 语音 样本 。 以 第 1 类 数据 样 
本 为 例 ,第 1 类 数据 样本 集中 480 像素 X640 像素 JPEG 图 片 数 据 格式 的 数据 样本 有 809 
个 .480 像素 X 640 像素 TIFF 图 片 数据 格式 的 数据 样本 有 8367 个 、480 像素 X 640 像素 
BMP 图 片 数 据 格 式 的 数据 样本 有 67 个 .2576 像素 X1932 像素 JPEG 图 片 数据 格式 的 数据 样 
本 有 5362 个 .2576 像素 X1932 像素 TIFF 图 片 数据 格式 的 数据 样本 有 32 个 .2576 像素 xX 
1932 像素 BMP 图 片 数据 格式 的 数据 样本 有 136 个 ,其 中 数据 样本 数量 最 大 的 数据 格式 是 
480 像素 X640 像素 TIFF 图 片 数 据 格式 ,所 以 将 480 像素 X640 像素 TIFF 图 片 数据 格式 
作为 第 1 类 数据 样本 的 数据 预 设 格式 。 

获取 每 一 类 数据 样本 集 对 应 的 标签 集中 每 一 个 标签 的 标签 格式 ,将 所 有 类 中 相同 的 标 
签 格 式 进行 合并 得 到 至 少 1 种 标签 格式 ,统计 该 类 标签 集中 每 一 种 标签 格式 Qi 对 应 的 标签 
数量 N; ,将 最 大 的 Ni 对 应 的 标签 格式 Qi 作为 标签 预 设 格 式 ; 其 中 ,1 三 1, j 宇 1 A j<i。 
例如 ,共有 两 类 数据 样本 集 对 应 的 标签 集 ,第 1 类 数据 样本 集 对 应 的 标签 集中 ,身份 证 号 标 
EA 5636 个 ,姓名 标签 有 5426 个 ; 第 2 类 数据 样本 集 对 应 的 标签 集中 ,身份 证 号 标签 有 
2654 个 ,姓名 标签 有 235 个 , 则 两 类 数据 样本 集 对 应 的 标签 集中 身份 证 号 标签 有 8290 4, 
姓名 标签 有 5661 个 ,所 以 将 身份 证 号 标签 作为 标签 预 设 格式 。 

然后 对 输入 的 两 类 数据 样本 集 和 标签 集 进行 预 处 理 , 结 合 图 1-5, 以 第 1 类 数据 样本 集 
和 标签 集 为 例 ,具体 过 程 为 : 
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获取 NN 类 数据 样本 集 及 对 应 的 标签 集 ， 每 一 
类 数据 样本 的 数据 预 设 格式 、 标 签 预 设 格式 


1 1 
类 数据 样本 集 。 | -一 一- 一 一 一 一- 一 入 类 对 应 的 标签 集 
| | 
预 处 理 预 处 理 
初始 化 N 个 深度 学 习 神经 网 络 
输入 


每 一 类 任 一 测试 数据 


| 


为 该 类 数据 的 数据 预 设 格式 


每 一 类 测试 输出 标签 
作为 该 类 的 可 能 输出 
标签 及 最 优 输出 标签 


测试 数据 的 数据 格式 转化 “| 对 应 输入 


深度 学 习 神经 网 络 训练 


NA 个 训练 后 的 神经 网 络 


对 应 输出 


每 一 类 测试 输出 标签 


查找 测试 输出 标签 所 在 的 预 
处 理 之 后 的 标签 集 


1 二 1 


标签 集中 标签 
元 素 的 个 数 /2 


计算 每 一 类 测试 输出 标签 所 对 应 的 数据 样本 
集 与 该 类 测试 输出 标签 所 在 标签 集中 每 一 标 
签 元 素 对 应 的 数据 样本 集 的 相似 度 


| 


| m 组 可 能 输出 标签 (m1) 


i 


计算 每 一 组 可 能 输出 标签 中 每 一 类 可 能 输出 标签 所 
对 应 的 数据 样本 集 与 该 一 类 测试 数据 集 的 相似 度 


| 得 到 一 组 最 优 输 出 标签 


计算 各 类 输出 标签 一 致 
及 不 一 致 的 概率 


将 可 能 输出 标签 、 最 优 输 
出 标签 及 各 类 输出 标签 
一 致 和 不 一 致 的 概率 输出 


图 1-4 基于 联合 聚 类 深度 学 习 模型 的 数据 识别 方法 流程 


每 一 类 数据 样本 集中 
的 每 一 个 数据 样本 格式 是 否 与 该 类 
的 数据 预 设 格式 一 致 ? 


N 类 数据 样本 集 
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tp 
Be 
x 


对 应 的 标签 格式 是 否 与 标签 


不 集中 的 每 一 个 数据 样 术 
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1 
更 新 后 的 N 类 数据 样本 集 
——<— ee 一 
第 1 类 数据 样本 集 第 2 类 数据 样本 集 第 N 类 数据 样本 集 
4 1 了 
聚 类 处 理 聚 类 处 理 聚 类 处 理 

1 1 | 
JI 个 聚 类 后 的 数据 样本 .个 聚 类 后 的 数据 样本 个 聚 类 后 的 数据 样本 
集 及 对 应 的 输出 标签 集 集 及 对 应 的 输出 标签 集 集 及 对 应 的 输出 标签 集 


本 集 及 对 应 的 输出 标签 集 


了 1 1 
将 每 个 输出 标签 集中 相 将 每 个 输出 标签 集中 相 将 每 个 输出 标签 集中 相 
同 的 标签 进行 合并 同 的 标签 进行 合并 同 的 标签 进行 合并 

i | | 
将 具有 相同 标签 的 输出 将 具有 相同 标签 的 输出 将 具有 相同 标签 的 输出 
标签 集 及 对 应 的 数据 样 标签 集 及 对 应 的 数据 样 标签 集 及 对 应 的 数据 样 
本 集 分 别 进行 合并 本 集 分 别 进行 合并 本 集 分 别 进行 合并 

1 
得 到 预 处 理 后 的 N 类 数据 样 


图 1-5 基于 联合 聚 类 深度 学 习 模 型 的 数据 识别 方法 中 对 数据 样本 集 和 输出 标签 集 预 处 理 的 流程 


步骤 S1-1, 判 断 每 一 类 数据 样本 集中 每 一 数据 样本 的 数据 格式 是 否 与 该 类 数据 样本 的 
数据 预 设 格式 一 致 ,如 果 不 一 致 , 则 将 该 类 数据 样本 的 数据 格式 转化 为 该 类 数据 样本 的 数据 
预 设 格式 。 例 如 ,480 像素 X640 像素 TIFF 图 片 数 据 格式 是 第 一 类 数据 样本 的 数据 预 设 格 
式 , 如 果 第 一 类 数据 样本 集中 一 个 数据 样本 的 数据 格式 也 是 480 像素 X640 像素 TIFF 图 片 
数据 格式 ,与 第 一 类 数据 样本 的 数据 预 设 格式 相同 , 则 无 须 进行 转化 ; 如 果 第 一 类 数据 样本 
集中 一 个 数据 样本 的 数据 格式 是 2576 像素 X1932 像素 JPEG 图 片 数据 格式 ,与 第 一 类 数 
据 样本 的 数据 预 设 格 式 不 同 , 则 须 转 化 为 480 像素 X640 像素 的 TIFF 图 片 数 据 格式 。 


步骤 S1-2 ,判断 每 一 类 数据 样本 集中 每 一 


个 数据 样本 对 应 的 标签 的 数据 格式 是 否 与 标 


签 预 设 格式 一 致 ,如 果 不 一 致 , 则 将 该 类 数据 样本 对 应 的 标签 的 数据 格式 转化 为 标签 预 设 格 
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式 。 例 如 ,身份 证 号 标签 作为 标签 预 设 格式 ,如 果 第 一 类 数据 样本 集中 一 个 数据 样本 对 应 的 
标签 的 数据 格式 是 身份 证 号 格式 ,与 标签 预 设 格式 相同 , 则 无 须 进行 转化 ; 如 果 第 一 类 数据 
样本 集中 一 个 数据 样本 对 应 的 标签 的 数据 格式 是 姓名 格式 ,与 标签 预 设 格式 不 同 , 则 须 转化 
为 身份 证 号 格式 。 

步骤 S1-3 ,对 第 1 类 数据 样本 集 进行 聚 类 处 理 , 获 得 7 个 聚 类 后 的 数据 样本 集 及 其 对 应 
的 输出 标签 集 。 具 体 为 : 

首先 对 第 1 类 数据 样本 集 { 头 像 11, 头 像 12,…… ,头像 1m) 进 行 聚 类 , 聚 类 的 规则 
是 : 将 相似 度 大 于 头像 相似 度 预 设 阔 值 (默认 值 为 90 站 ) 的 头像 加 入 到 同一 个 聚 类 (即将 
上 述 头像 内 部 进行 相似 度 计算 ,如 果 相 似 度 大 于 90%% , 则 将 相应 的 头像 加 入 一 个 聚 类 ) ， 
使 得 一 个 聚 类 中 任 一 头像 都 在 该 个 聚 类 中 存在 另 一 头像 与 该 个 头像 的 相似 度 大 于 头像 
相似 度 预 设 阔 值 (默认 值 为 90%) ,同时 使 得 一 个 聚 类 中 任 一 头像 都 在 另 一 个 聚 类 中 不 存 
在 任 一 头像 与 该 头像 的 相似 度 大 于 头像 相似 度 预 设 阔 值 ( 默 认 值 为 90 上 ); 每 一 头像 只 
属于 一 个 聚 类 。 根 据 该 聚 类 规则 ,得 到 第 一 个 聚 类 { 头 像 111, 头 像 112,…… ,头像 11lma } ， 
第 2 个 聚 类 { 头 像 211, 头 像 212,……: ;头像 21mzz )，…… ,第 j 个 聚 类 { 头 像 ja ,头像 
i es ,头像 jim, } 了 

然后 对 第 1 类 数据 样本 集 对 应 的 标签 集 进行 聚 类 。 第 1 类 数据 样本 集 的 第 1 个 聚 类 

{头像 111, 头 像 112,…… ,头像 11m) 对 应 的 输出 标签 的 集合 为 (身份 证 号 111, 身 份 证 号 
Drea ,身份 证 号 11m) ,作为 第 1 类 输出 标签 的 第 1 个 聚 类 ; 数据 样本 集 的 第 2 个 聚 类 
{头像 211 ,头像 212,…… ,头像 21ms) 对 应 的 输出 标签 的 集合 为 {身份 证 号 211, 身 份 证 号 


212 ye ,身份 证 号 21n;) ,作为 第 1 类 输出 标签 的 第 2 个 聚 类 ; ……; 数据 样本 集 的 第 j 
ARRAS SEAR Fn SEAR fie tte ,头像 im, } 对 应 的 输出 标签 的 集合 为 { 身 份 证 号 in ,身份 证 
jist ,身份 证 号 jim, 人 作为 第 1 类 输出 标签 的 第 j 个 聚 类 。 


步骤 S1-4, 对 上 述 j 个 聚 类 后 的 输出 标签 集中 每 个 类 中 相同 的 标签 进行 合并 ,得 到 更 新 
后 的 j 个 输出 标签 集 。 

步骤 S1-5, 将 更 新 后 的 j 个 输出 标签 集中 具有 相同 标签 的 标签 集 及 对 应 的 数据 样本 集 
分 别 进行 合并 ,得 到 预 处 理 后 的 数据 样本 集 及 其 对 应 的 输出 标签 集 。 

例如 ,第 1 类 数据 样本 集 的 第 1 个 聚 类 {头像 111, 头 像 112.…… ,头像 11mm) 对 应 的 输 
出 标签 的 集合 为 {身份 证 号 111, 身 份 证 号 112,…… ,身份 证 号 11mm); 数据 样本 集 的 第 2 个 
聚 类 {头像 211 ,头像 212，…… ,头像 21ms)} 对 应 的 输出 标签 的 集合 为 {身份 证 号 211 ,身份 证 
212,000 ,身份 证 号 21maz}; 如 果 第 2 个 聚 类 对 应 的 输出 标签 的 集合 中 身份 证 号 212 与 
第 1 个 聚 类 对 应 的 输出 标签 的 集合 中 身份 证 号 116 相同 , 则 将 第 2 个 聚 类 对 应 的 输出 标签 
的 集合 与 第 1 个 聚 类 对 应 的 输出 标签 的 集合 合并 ,同时 将 第 2 个 聚 类 对 应 的 数据 样本 集 与 
第 1 个 聚 类 对 应 的 数据 样本 集合 并 。 

(2) 步骤 S2 ,初始 化 N 类 数据 样本 集 对 应 的 N 个 深度 学 习 模 型 。 

(3) 步骤 S3 ,将 步骤 S1 获取 的 每 类 数据 样本 集 作 为 输入 ,将 其 对 应 的 标签 集 作 为 输 
出 ,对 该 类 对 应 的 深度 学 习 模型 进行 训练 .得 到 两 个 训练 后 的 神经 网 络 。 结 合 图 1-6, 具 
体 为 : 

步骤 S3-1 ,将 每 类 数据 样本 集中 每 一 个 数据 样本 作为 该 类 对 应 的 深度 学 习 模 型 的 输 
入 ,对 该 类 对 应 的 深度 学 习 模 型 进行 自 下 而 上 的 无 监督 训练 。 
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第 1 类 输入 第 N 类 输入 
数据 样本 集 数据 样本 集 
第 1 类 深度 学 第 N 类 深度 学 
习 神经 网 络 习 神 经 网 络 
i 
自 下 而 上 的 自 下 而 上 的 
无 监督 训练 无 监督 训练 
输入 输入 | 
了 
NIE 
习 神 经 网 络 
标签 偷 出 标签 
输出 标签 集 输出 标签 集 | 
自 项 向 下 的 自 项 向 下 的 
有 监督 训练 有 监督 训练 


AN 个 训练 后 的 深 
度 学 习 神经 网 络 


图 1-6 基于 联合 聚 类 深度 学 习 模 型 的 数据 识别 方法 中 深度 学 习 模 型 训练 的 流程 


2G DR S3-2 ,将 每 类 数据 样本 集中 每 一 个 数据 样本 作为 该 类 对 应 的 深度 学 习 模型 的 输 
入 ,将 对 应 的 标签 集中 的 对 应 标签 作为 输出 ,对 该 类 对 应 的 深度 学 习 模 型 进行 自 顶 向 下 的 监 
督学 习 , 得 到 两 个 训练 后 的 深度 学 习 模型 。 

步骤 S3-3 ,为 每 一 类 对 应 的 深度 学 习 模型 获取 一 个 测试 数据 ,将 每 一 类 测试 数据 的 数据 
格式 转化 为 该 类 数据 的 数据 预 设 格式 。 例 如 ,480 像素 X640 像素 TIFF 图 片 数据 格式 是 第 1 
类 数据 样本 的 数据 预 设 格式 ,如 果 第 1 类 该 测试 数据 的 数据 格式 也 是 480 像素 X 640 像素 
TIFF 图 片 数据 格式 ,与 第 1 类 数据 样本 的 数据 预 设 格 式 相同 , 则 无 须 进 行 转化 ; 如 果 第 1 
类 该 测试 数据 的 数据 格式 是 2576 像素 X1932 像素 JPEG 图 片 数据 格式 ,与 第 1 类 数据 样本 
的 数据 预 设 格式 不 同 , 则 须 转化 为 480 像素 X640 像素 的 TIFF 图 片 数据 格式 。 

然后 将 该 测试 数据 作为 该 类 对 应 的 深度 学 习 模 型 的 输入 ,通过 该 深度 学 习 模型 的 计算 
得 到 该 类 对 应 的 测试 输出 标签 。 例 如 ,输入 第 1 类 任 一 测试 数据 “头像 1p” 到 第 1 类 对 应 的 
深度 学 习 模 型 ,得 到 测试 输出 标签 “ 张 三 身 份 证 号 ”; 输入 第 2 类 任 一 测试 数据 “语音 2q” Bi) 
第 2 类 对 应 的 深度 学 习 模 型 ,得 到 测试 输出 标签 “ 李 四 身 份 证 号 ”。 

步骤 S3-4, 在 步骤 S1 预 处 理 的 标签 集中 查找 每 一 类 的 测试 输出 标签 所 在 的 标签 集 , 之 
后 判断 该 标签 集 是 否 只 有 一 个 标签 元 素 ; 如 果 每 一 类 的 测试 输出 标签 所 在 的 标签 集 只 有 一 
个 标签 元 素 , 则 将 每 一 类 的 测试 输出 标签 作为 该 类 的 最 优 输 出 标签 ,即将 步 又 S1-4 中 “ 张 三 
身份 证 号 六 李 四 身份 证 号 ?分 别 作为 第 1 类、 第 2 类 的 最 优 输出 标签 ; 否则 执行 下 一 步 。 

步骤 S3-5 ,计算 每 一 类 的 测试 输出 标签 所 对 应 的 数据 样本 集 与 该 类 测试 输出 标签 所 在 
的 标签 集中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 ,并 根据 该 相似 度 计算 并 确定 每 一 组 
可 能 输出 标签 ; 其 中 ,每 一 组 可 能 输出 标签 中 包含 了 每 一 类 的 一 个 可 能 输出 标签 。 例 如 , 步 
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又 S1-4 中 * 张 三 身份 证 号 ?所 在 第 1 类 输出 标签 集 为 { 朱 一 身份 证 号 , 郑 二 身份 证 号 , 张 三 身 
份 证 号 , 吴 七 身份 证 号 } ,对 应 的 数据 样本 集 为 { 朱 一 头像 集 , 郑 二 头像 集 , 张 三 头像 集 , 吴 七 
头像 集 } ;“ 李 四 身份 证 号 ”所 在 第 2 类 输出 标签 集 为 { 田 一 身份 证 号 , 李 四 身 份 证 号 , 吴 七 身 
份 证 号 ,对 应 的 数据 样本 集 为 { 田 一 语音 集 , 李 四 语音 集 , 吴 七 语音 集 }。 假 设 有 N 类 数据 
样本 集 及 对 应 的 标签 集 , 具 体 过 程 分 为 以 下 两 种 情况 。 

第 一 种 情况 : 当 N=1 时 ,只 有 一 类 数据 样本 集 及 对 应 的 标签 集 。 例 如 , 仅 存 在 上 述 第 
1 类 数据 样本 集 及 对 应 的 标签 集 。 

计算 测试 输出 标签 所 对 应 的 数据 样本 集 { 张 三 头像 集 } 与 测试 输出 标签 所 在 的 标签 集中 
每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 , 则 得 到 { 张 三 头像 集 } 与 { 朱 一 头像 集 } 的 相似 度 
ar 为 80%,{ 张 三 头像 集 } 与 { 郑 二 头像 集 } 的 相似 度 os WN 90% ,{ 张 三 头像 集 } 与 { 张 三 头像 
集 } 的 相似 度 as 为 100%,{ 张 三 头像 集 } 与 { 吴 七 头像 集 } 的 相似 度 a, 为 92%。 其 中 a as, 
as 均 大 于 第 一 预 设 值 80% ,所 以 存在 三 组 可 能 输出 标签 ,分 别 为 “ 郑 二 身份 证 号 ”“ 张 三 身份 
证 号 ”“ 吴 七 身份 证 号 ”。 

第 二 种 情况 : 当 N>1 时 ,有 多 类 数据 样本 集 及 对 应 的 标签 集 。 例 如 N==2, 包 括 上 述 
第 1 类 数据 样本 集 及 对 应 的 标签 集 、 第 2 类 数据 样本 集 及 对 应 的 标签 集 。 

首先 计算 第 1 类 测试 输出 标签 所 对 应 的 数据 样本 集 !{ 张 三 头像 集 } 与 测试 输出 标签 所 在 
的 标签 集中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 。 相 似 度 计算 结果 同上 述 N=1 的 

然后 计算 第 2 类 测试 输出 标签 所 对 应 的 数据 样本 集 { 李 四 语 音 集 ) 与 测试 输出 标签 所 在 
的 标签 集中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 。 则 得 到 { 李 四 语音 集 } 与 { 田 一 语音 
集 } 的 相似 度 户 为 95%% ,{ 李 四 语音 集 } 与 { 李 四 语音 集 } 的 相似 度 5 为 100%,{ 李 四 语音 集 } 
与 { 吴 七 语音 集 } 的 相似 度 加 为 85%。 

最 后 计算 所 有 可 能 输出 标签 组 各 自 的 相似 度 第 一 综合 值 , 输 出 标签 组 cy { 朱 一 身份 证 
号 , 田 一 身份 证 号 } 的 相似 度 第 一 综合 值 fi 为 80% X 95% =76% ,输出 标签 组 cs{ 朱 一 身份 
证 号 , 李 四 身 份 证 号 } 的 相似 度 第 一 综合 值 户 WV 80% X 100% = 80% ,输出 标签 组 cs { 朱 一 
身份 证 号 , 吴 七 身份 证 号 } 的 相似 度 第 一 综合 值 f; 为 80% X 85% = 68% ,输出 标签 组 cs { 郑 
二 身份 证 号 , 田 一 身份 证 号 } 的 相似 度 第 一 综合 值 f, 为 900%X95% 二 85.5%, 输 出 标签 组 
cs{ 郑 二 身份 证 号 , 李 四 身 份 证 号 } 的 相似 度 第 一 综合 值 fs 9 90% X 100% = 90% ,输出 标签 
组 ce{ 郑 二 身份 证 号 , 吴 七 身份 证 号 } 的 相似 度 第 一 综合 值 fs 90% X 85% = 76. 5% . Mi 
标签 组 cr{ 张 三 身份 证 号 , 田 一 身份 证 号 } 的 相似 度 第 一 综合 值 f7 Wy 100% X95%=95%, 
输出 标签 组 cs{ 张 三 身份 证 号 , 李 四 身份 证 号 } 的 相似 度 第 一 综合 值 fs 为 100% X 100% = 
100% ,输出 标签 组 cs { 张 三 身份 证 号 , 吴 七 身份 证 号 } 的 相似 度 第 一 综合 值 fo 为 100% X 
85%=85% ,输出 标签 组 ce { 吴 七 身份 证 号 , 田 一 身份 证 号 } 的 相似 度 第 一 综合 值 Ah 为 
92% X95 %=87.4%. MEA cu { 吴 七 身份 证 号 , 李 四 身 份 证 号 } 的 相似 度 第 一 综合 值 
Su Ft 92% X 100% = 92% ,输出 标签 组 cz{ 吴 七 身份 证 号 , 吴 七 身份 证 号 } 的 相似 度 第 一 综 
合 值 piz 为 92%X85% 二 78.2%。 其 中 ,f4、fs、f1、fs、fio、fu 均 大 于 第 二 预 设 值 85%, 所 以 
有 6 组 可 能 输出 标签 ,分 别 为 cocs ez scs .cao ca 对 应 的 输出 标签 组 。 

(4) 步骤 S4, 计 算 由 步骤 S3 得 到 的 每 一 组 可 能 输出 标签 中 每 一 类 的 可 能 输出 标签 对 
应 的 数据 样本 集 与 该 类 测试 数据 集 的 相似 度 , 并 根据 该 相似 度 计算 并 确定 一 组 可 能 输出 标 
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签 作为 最 优 输 出 标签 。 对 应 步骤 S3 中 的 内 容 , 具 体 过 程 分 为 以 下 两 种 情况 。 

第 一 种 情况 : 当 N=1 时 ,由 步骤 S3 可 知 , 有 3 组 可 能 输出 标签 分 别 为 “ 郑 二 身份 证 
号 ”“ 张 三 身份 证 号 ”和 “ 吴 七 身份 证 号 ”。 其 中 可 能 输出 标签 “ 张 三 身 份 证 号 ”的 相似 度 值 最 
,因此 将 其 作为 最 优 输 出 标签 组 。 

第 二 种 情况 : 当 N>1 时 ,由 步骤 S3 可 知 , 有 cs ,cs .cr cs\cno\cua 共 6 组 可 能 输出 标签 ， 
具体 过 程 如 下 : 

首先 计算 每 一 组 可 能 输出 标签 中 第 1 类 的 可 能 输出 标签 对 应 的 数据 样本 集 与 该 类 测试 
数据 集 { 张 三 头像 集 } 的 相似 度 , 则 得 到 { 郑 二 头像 集 } 与 { 张 三 头像 集 } 的 相似 度 为 90%,{ 张 
三 头像 集 } 与 { 张 三 头像 集 } 的 相似 度 为 100% ,{ 吴 七 头像 集 } 与 { 张 三 头像 集 } 的 相似 度 
为 92%。 

然后 计算 每 一 组 可 能 输出 标签 中 第 2 类 的 可 能 输出 标签 对 应 的 数据 样本 集 与 该 类 测试 
数据 集 { 李 四 语音 集 } 的 相似 度 , 则 得 到 { 李 四 语音 集 } 与 { 李 四 语音 集 } 的 相似 度 为 100%， 
{ 田 一 语音 集 } 与 { 李 四 语音 集 } 的 相似 度 为 95% 

则 cy 输出 标签 组 { 郑 二 身份 证 号 , 田 一 身份 证 号 } 相 似 度 第 二 综合 值 g 为 90% X95 KH = 
85.5% ,cs 输出 标签 组 { 郑 二 身份 证 号 , 李 四 身 份 证 号 } 相 似 度 第 二 综合 值 gs 为 900% X 
100% =90% ,cr 输出 标签 组 { 张 三 身份 证 号 , 田 一 身份 证 号 } 相 似 度 第 二 综合 值 gp 为 100% X 
95% =95% » cq 输出 标签 组 { 张 三 身份 证 号 , 李 四 身份 证 号 } 相 似 度 第 二 综合 值 gs 为 100% XX 
100% =100% ,co 输出 标签 组 { 吴 七 身份 证 号 , 田 一 身份 证 号 } 相 似 度 第 二 综合 值 gt 为 92% x 
95% 三 87.4%, cu 输出 标签 组 { 吴 七 身份 证 号 , 李 四 身 份 证 号 ) 相 似 度 第 二 综合 值 gu 为 
92% X100% 二 92%。 其 中 相似 度 第 二 综合 值 最 大 的 是 gs ,因此 将 cs 输出 标签 组 { 张 三 身份 
证 号 , 李 四 身 份 证 号 ;作为 最 优 输出 标签 组 。 

(5) 步骤 S5, 计 算 可 能 输出 标签 中 各 类 输出 标签 都 一 致 及 不 一 致 的 概率 ,作为 各 类 输 
出 标签 一 致 及 不 一 致 的 概率 。 对 应 步骤 S3 中 的 内 容 , 具 体 过 程 分 为 以 下 两 种 情况 。 

第 一 种 情况 : 当 N=1 时 ,由 步骤 S3 可 知 ,只 有 一 类 输出 标签 ,因此 各 类 输出 标签 一 致 
的 概率 为 100% ,不 一 致 的 概率 为 0。 

第 二 种 情况 : 当 N>1 时 ,由 步骤 S3 可 知 , 有 ce cs cr cs cao\cu 共 6 组 可 能 输出 标签 。 
其 中 cy 输出 标签 组 { 郑 二 身份 证 号 , 田 一 身份 证 号 } 中 各 类 可 能 输出 标签 不 一 致 ，cs 输出 标 
签 组 { 郑 二 身份 证 号 , 李 四 身 份 证 号 } 中 各 类 可 能 输出 标签 不 一 致 ， cy 输出 标签 组 { 张 三 身份 
证 号 , 田 一 身份 证 号 } 中 各 类 可 能 输出 标签 不 一 致 ， cs 输出 标签 组 { 张 三 身份 证 号 , 李 四 身 份 
证 号 } 中 各 类 可 能 输出 标签 不 一 致 ,co 输出 标签 组 { 吴 七 身份 证 号 , 田 一 身份 证 号 } 中 各 类 可 
能 输出 标签 不 一 致 ， cu 输出 标签 组 { 吴 七 身份 证 号 , 李 四 身 份 证 号 } 中 各 类 可 能 输出 标签 不 
一 致 。 由 上 述 可 知 ,所 有 可 能 输出 标签 组 中 各 类 可 能 输出 标签 均 不 一 致 ,所 以 各 类 输出 标签 
一 致 的 概率 为 0, 不 一 致 的 概率 为 100% ,说明 各 类 测试 样本 对 应 同一 个 人 的 概率 为 0。 

为 了 进一步 曾 明 过 程 ,假设 有 4 组 可 能 输出 标签 ds .ds .do dir ,ds 输出 标签 组 { 郑 二 身 
份 证 号 , 郑 二 身份 证 号 ) 中 各 类 可 能 输出 标签 一 致 .对 应 的 相似 度 第 二 综合 值 为 89%; ds 输 
出 标签 组 { 张 三 身份 证 号 , 张 三 身 份 证 号 } 中 各 类 可 能 输出 标签 一 致 ,对 应 的 相似 度 第 二 综合 
值 为 53%; di 输出 标签 组 { 郑 二 身份 证 号 , 李 四 身 份 证 号 } 中 各 类 可 能 输出 标签 不 一 致 ,对 
应 的 相似 度 第 二 综合 值 为 67%; du 输出 标签 组 { 人 

输出 标签 不 一 致 ,对 应 的 相似 度 第 二 综合 值 为 75 


a 
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判断 结果 为 一 致 的 各 组 可 能 输出 标签 对 应 的 相似 度 第 二 综合 值 之 和 (89% 十 53%) 除 以 
所 有 可 能 输出 标签 对 应 的 相似 度 第 二 综合 值 之 和 (89% 十 53% 十 67% 十 75%) ,得 到 各 类 输 
出 标签 一 致 的 概率 为 50%。 以 100% 减 去 各 类 输出 标签 一 致 的 概率 50%, 则 得 到 各 类 输出 
标签 不 一 致 的 概率 为 50% 。 

(6) 步骤 S6 ,将 可 能 输出 标签 .最 优 输 出 标签 .各 类 输出 标签 一 致 及 不 一 致 的 概率 输出 。 


Ell 


1.2.2 联合 聚 类 深度 学 习 模 型 的 数据 识别 系统 


联合 聚 类 深度 学 习 模 型 的 数据 识别 系统 包括 : 

(1) 采集 模块 1, 用 于 N 类 数据 样本 集 及 每 一 类 数据 样本 集 对 应 的 标签 集 , 再 获取 N 
类 数据 样本 集中 每 一 类 数据 样本 的 数据 预 设 格式 ,并 获取 标签 预 设 格式 ,然后 对 N 类 数据 
样本 集 和 标签 集 进 行 预 处 理 ; N 三 1。 

(2) 初始 化 模块 2, 用 于 初始 化 N 类 数据 样本 集 对 应 的 N 个 深度 学 习 模型 。 

(3) 训练 模块 3, 用 于 将 获取 的 每 一 类 数据 样本 集 作为 输入 ,将 其 对 应 的 标签 集 作 为 输 
出 ,对 该 类 对 应 的 深度 学 习 模 型 进行 训练 ,得 到 N 个 训练 后 的 深度 学 习 模 型 。 

(4) 测试 模块 4, 用 于 为 每 一 类 对 应 的 深度 学 习 模 型 获取 一 个 测试 数据 ,将 每 一 类 测试 
数据 的 数据 格式 转化 为 该 类 数据 样本 的 数据 预 设 格式 ,然后 将 该 测试 数据 作为 该 类 对 应 的 
深度 学 习 模 型 的 输入 ,通过 该 深度 学 习 模型 的 计算 得 到 该 类 对 应 的 测试 输出 标签 。 

(5) 判别 模块 5, 用 于 在 预 处 理 的 标签 集中 查找 每 一 类 的 测试 输出 标签 所 在 的 标签 集 ， 

后 判断 该 标签 集 是 否 只 有 一 个 标签 元 素 。 如 果 每 一 类 的 测试 输出 标签 所 在 的 标签 集 只 有 
一 个 标签 元 素 , 则 将 每 一 类 的 测试 输出 标签 作为 该 类 的 最 优 输 出 标签 ; 否则 执行 下 一 步 。 

(6) 第 一 相似 度 计算 模块 6, 用 于 计算 每 一 类 的 测试 输出 标签 所 对 应 的 数据 样本 集 与 该 
类 测试 输出 标签 所 在 的 标签 集中 每 一 标签 元 素 对 应 的 数据 样本 集 的 相似 度 , 根 据 该 相似 度 
计算 并 确定 每 一 组 可 能 输出 标签 ; 其 中 ,每 一 组 可 能 输出 标签 中 包含 了 每 一 类 的 一 个 可 能 
输出 标签 。 

(7) 第 二 相似 度 计算 模块 7, 用 于 计算 每 一 组 可 能 输出 标签 中 每 一 类 的 可 能 输出 标签 对 
应 的 数据 样本 集 与 该 类 测试 数据 集 的 相似 度 , 并 根据 该 相似 度 计算 并 确定 一 组 可 能 输出 标 
签 作为 最 优 输出 标签 。 

(8) 概率 统计 模块 8, 用 于 计算 可 能 输出 标签 中 各 类 输出 标签 都 一 致 及 不 一 致 的 概率 ， 
作为 各 类 输出 标签 一 致 及 不 一 致 的 概率 。 

(9) 输出 模块 9, 用 于 将 可 能 输出 标签 、 最 优 输出 标签 .各 类 输出 标签 一 致 及 不 一 致 的 概 
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现 有 技术 中 深度 学 习 技 术 能 通过 输入 数据 得 到 输出 标签 (例如 ,通过 头像 得 到 该 人 身份 
证 号 ,或 者 通过 语音 得 到 该 人 身份 证 号 ) ,在 自 顶 向 下 的 监督 训练 阶段 需要 通过 带 有 标签 的 
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数据 (例如 , 带 有 身份 证 号 的 头像 .或 者 带 有 身份 证 号 的 语音 ) 进 行 监督 训练 (即将 数据 样本 
作为 深度 学 习 模型 的 输入 ,标签 作为 深度 学 习 模 型 的 输出 )。 

但 是 ,由 于 深度 学 习 模型 的 准确 率 无 法 达到 100% ,所 以 一 个 头像 输入 深度 学 习 模 型 后 
输出 的 身份 证 号 可 能 是 另 一 个 头像 相似 的 人 的 身份 证 号 ,一 个 语音 输入 深度 学 习 模 型 后 输 
出 的 身份 证 号 可 能 是 另 一 个 语音 相似 的 人 的 身份 证 号 。 进 行 用 户 身份 识别 时 ,为 了 提高 识 
别 的 准确 性 ,一般 需要 采集 用 户 的 多 类 数据 ,进行 综合 判断 ,但 这 样 会 增加 采集 的 成 本 ,而 且 
采集 越 多 类 数据 就 会 给 用 户 造成 越 多 的 不 便 , 并 且 在 很 大 程度 上 耽误 了 用 户 的 时 间 , 所 以 需 
要 通过 尽量 少 的 测试 类 别 来 得 到 准确 的 判断 。 但 现 有 深度 学 习 模 型 技术 无 法 实现 通过 多 类 
深度 学 习 模型 进行 综合 辨别 和 "9 ,也 无 法 进行 类 别 的 选择 。 

本 技术 研究 并 给 出 了 一 种 新 的 基于 深度 学 习 模型 的 身份 识别 方法 和 系统 ,具体 为 : OAK 
取 N 类 输入 数据 ; 四 初始 化 对 应 的 N 类 深度 学 习 模 型 ; QUA N 类 深度 学 习 模型 ; OR 
据 采集 成 本 从 低 到 高 对 类 别 进行 排序 ; @ 初 始 化 i 最 优 输出 标签 .最 大 相似 度 相 对 比值 
Us @ 计 算 T; 类 测试 输出 标签 L; ,并 判断 工 是 否 与 L; 相同 ; 获取 类 相似 度 相 对 比值 
U; 并 根据 上 一 步 的 结果 判别 是 身份 识别 失败 还 是 执行 下 一 步 ; @ HH LMU; OH U 
与 预 设 最 大 相似 度 相 对 比值 < 的 关系 与 N 的 关系 ,判别 身份 是 否 识 别 成 功 、 是 否 需 要 将 i 
加 1 继续 循环 执行 。 本 技术 方案 优先 选择 低 成 本 测试 数据 ,并 逐渐 增加 测试 输入 类 型 ,在 最 
低 成 本 的 情况 下 取得 最 高 的 判别 准确 率 。 


1.3.1 基于 深度 学 习 模 型 的 身份 识别 方法 


1, 基于 深度 学 习 模型 的 N 类 身份 识别 

一 种 基于 深度 学 习 模 型 的 身份 识别 方法 ,包括 以 下 步骤 。 

(1) 步骤 S1 ,获取 用 于 身份 识别 的 N 类 输入 数据 。 

(2) 步骤 S2 ,初始 化 N 类 输入 数据 对 应 的 NN 类 深度 学 习 模 型 。 具 体 为 : 

步骤 S2-1, 初 始 化 每 一 类 深度 学 习 模型 的 输入 格式 为 对 应 类 的 输入 数据 的 格式 。 

步骤 S2-2 ,初始化 每 一 类 深度 学 习 模 型 的 输出 格式 为 用 户 身 份 信息 的 格式 。 

(3) 步 又 S3, 对 N 类 深度 学 习 模型 进行 训练 。 具 体 为 : 

步 又 S3-1 ,获取 N 类 中 每 一 类 训练 输入 数据 ,并 将 其 作为 该 类 对 应 的 深度 学 习 模 型 的 
输入 ,进行 自 下 而 上 的 无 监督 训练 。 

步骤 S3-2 ,获取 N 类 中 每 一 类 带 有 标签 的 训练 输入 数据 及 其 对 应 的 预期 输出 标签 ,并 
将 其 分 别 作为 该 类 对 应 的 深度 学 习 模型 的 输入 数据 与 预期 输出 标签 ,进行 自 顶 向 下 的 有 监 
督 训练 。 

(4) 步骤 S4, 获 取 N 类 输入 数据 中 每 一 类 输入 数据 的 采集 成 本 ,根据 采集 成 本 从 低 到 
高 对 类 别 进行 排序 ,得 到 N 类 已 排序 的 类 别 为 了 ,T;,…, Tx; 其 中 采集 成 本 是 经 济 成 本 与 
时 间 成 本 的 加 权 平 均 。 

(5) 步骤 S5 ,初始 化 ;一 1, 待 识别 身份 用 户 的 最 优 输 出 标签 工 一 名 ,最 大 相似 度 相对 比 
值 U=0; 其 中 i 为 自然 数 , 取 值 范围 为 1<i<N。 

(6) 步骤 S6 ,获取 一 个 待 识别 身份 用 户 的 T 类 测试 输入 数据 ,将 其 作为 Ti 类 深度 学 习 
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模型 的 输入 ,通过 T; 类 深度 学 习 模 型 计算 得 到 了, 类 测试 输出 标签 L;; 判断 最 优 输 出 标签 
LEAN MAT, 类 测试 输出 标签 工 ; 相同 ,如果 为 空 或 相同 , 则 执行 步骤 S7 ,否则 执行 步 
又 S8。 

(7) 步骤 S7, 获 取 T; 类 相似 度 相 对 比值 U; ,然后 执行 步骤 S9。 

其 中 ,获取 T; 类 相似 度 相 对 比值 U; 具体 步骤 为 : 

首先 从 T; 类 训练 输入 数据 集中 搜索 预期 标签 与 T, 类 测试 输出 标签 志 ; 匹配 的 T; 类 训 
练 输入 数据 集 ,将 其 作为 T; 类 第 一 训练 输入 数据 集 ; 然后 计算 T; 类 第 一 训练 输入 数据 集 
中 每 一 训练 输入 数据 与 T, 类 测试 输入 数据 的 相似 度 , 将 其 中 最 大 的 相似 度 M; 与 T; 类 测 
试 相似 度 预 设 阔 值 w 的 比值 作为 T, 类 相似 度 相 对 比值 U;。 

(8) 步骤 S8 ,获取 T; 类 相似 度 相 对 比值 U; ,并 判别 是 身份 识别 失败 还 是 执行 步骤 S9 。 

其 中 ,获取 T; 类 相似 度 相 对 比值 U; 具体 步骤 为 ， 

首先 从 T; 类 训练 输入 数据 集中 搜索 预期 标签 与 Ti, 类 测试 输出 标签 L; 匹配 的 T; 类 训 
练 输入 数据 集 ,将 其 作为 T; 类 第 一 训练 输入 数据 集 ; 然后 计算 T; 类 第 一 训练 输入 数据 集 
中 每 一 训练 输入 数据 与 T, 类 测试 输入 数据 的 相似 度 , 将 其 中 最 大 的 相似 度 M; 与 T, 类 测 
试 相 似 度 预 设 阔 值 c; 的 比值 作为 T 类 相似 度 相 对 比值 U;。 

其 中 ,判别 是 身份 识别 失败 还 是 执行 步骤 S9, 具 体 为 步骤 ， 

步骤 S8-1, 从 T; 类 训练 输入 数据 集中 搜索 预期 标签 与 T, 类 测试 输出 标签 二; 匹配 的 
T; 类 训练 输入 数据 集 , 将 其 作为 T; 类 第 一 训练 输入 数据 集 。 

步 又 S8-2, 从 T 类 训练 输入 数据 集中 搜索 预期 标签 与 最 优 输 出 标签 工 匹配 的 T; 类 训 
练 输入 数据 集 ,将 其 作为 T; 类 第 二 训练 输入 数据 集 。 

步骤 S8-3 ,计算 T; 类 第 一 训练 输入 数据 集中 每 一 训练 输入 数据 与 第 二 训练 输入 数据 
集中 每 一 训练 输入 数据 的 相似 度 , 如 果 其 中 最 大 的 相似 度 Ni 大 于 等 于 T, 类 混淆 相似 度 预 
设 阔 值 六 , 则 执行 步骤 S9 ,否则 为 身份 识别 失败 。 

(9) 步骤 S9 ,判别 T; 类 相似 度 相对 比值 U; 与 最 大 相似 度 相 对 比值 U 之 间 的 关系 ,更 
新 最 优 输出 标签 L 和 最 大 相似 度 相 对 比值 U。 具 体 步 又 为 : 

如 果 U; 二 U, 则 将 最 优 输出 标签 工 设置 为 T; 类 输出 标签 ,将 最 大 相似 度 相 对 比值 U 设 
置 为 了 类 相似 度 相对 比值 U;; 否则 保持 最 优 输出 标签 L 和 最 大 相似 度 相 对 比值 U 不 变 。 

(10) 步骤 S10, 判 别 最 大 相似 度 相 对 比值 U 与 预 设 最 大 相似 度 相 对 比值 c 之 间 的 关 
Fs WAR U>c, 则 身份 识别 成 功 ,将 最 优 输出 标签 作为 识别 出 的 身份 标签 ; 否则 判别 i 与 N 
之 间 的 关系 ,如 果 i 三 NN, 则 身份 识别 失败 ,如 果 i 二 N. 则 将 i 加 1 并 返回 步骤 S6 继续 执行 。 

2. 基于 深度 学 习 模型 的 3 类 身份 识别 

结合 图 1-7, 以 N=3 为 例 , 本 技术 方案 基于 深度 学 习 模型 的 身份 识别 方法 ,包括 以 下 步骤 ; 

(1) 步骤 S1, 获 取 用 于 身份 识别 的 3 类 输入 数据 ,分 别 为 图 像 类 、 指 纹 类 和 语音 类 输入 
数据 。 

(2) 步骤 S2 ,初始 化 3 类 输入 数据 对 应 的 3 类 深度 学 习 模 型 。 具 体 步 骤 为 ， 

步骤 S2-1 ,初始 化 每 一 类 深度 学 习 模 型 的 输入 格式 为 对 应 类 输入 数据 的 格式 。 

例如 ,初始 化 图 像 类 深度 学 习 模 型 的 输入 格式 为 图 像 类 输入 数据 的 格式 。 

步骤 S2-2 ,初始 化 每 一 类 深度 学 习 模 型 的 输出 格式 为 用 户 身 份 信 息 的 格式 。 例 如 , 初 
始 化 图 像 类 深度 学 习 模 型 的 输出 格式 为 用 户 身 份 信息 的 格式 ,如 身份 证 号 。 


| 
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图 1-7 基于 深度 学 习 模型 的 身份 识别 方法 流程 


(3) 步 又 S3, 对 3 类 深度 学 习 模 型 进行 训练 。 结 合 图 1-8, 具 体 步骤 为 : 

步骤 S3-1, 获 取 3 类 中 每 一 类 训练 输入 数据 ,并 将 每 一 类 训练 输入 数据 作为 该 类 对 应 
的 深度 学 习 模 型 的 输入 ,进行 自 下 而 上 的 无 监督 训练 。 例 如 ,将 每 一 个 头像 作为 头像 类 深度 
学 习 模 型 的 输入 ,进行 自 下 而 上 的 无 监督 训练 。 
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图 1-8 基于 深度 学 习 模 型 的 身份 识别 方法 中 对 深度 学 习 模型 进行 训练 流程 


步骤 S3-2 ,获取 3 类 中 每 一 类 带 有 标签 的 训练 输入 数据 及 其 对 应 的 预期 输出 标签 ,并 
将 其 分 别 作 为 该 类 对 应 的 深度 学 习 模型 的 输入 数据 与 预期 输出 标签 ,进行 自 顶 向 下 的 有 监 
督 训 练 。 例 如 ,将 带 有 姓名 标签 的 头像 及 其 对 应 的 姓名 标签 分 别 作 为 头像 类 深度 学 习 模 型 
的 输入 数据 与 预期 输出 标签 ,进行 自 顶 向 下 的 监督 训练 。 

(4) 步骤 S4 ,获取 3 类 输入 数据 中 每 一 类 输入 数据 的 采集 成 本 ,根据 采集 成 本 从 低 到 高 
对 类 别 进 行 排序 ,得 到 3 类 已 排序 的 类 别 为 T.T, ,Ts; 其 中 采集 成 本 是 经 济 成 本 与 时 间 成 
本 的 加 权 平 均 。 例 如 ,图 像 类 采集 的 经 济 成 本 是 1 元 ,时 间 是 0. 3min, 则 采集 成 本 为 加 权 平 
均 (1 十 0.3)/2 二 0.65; 指纹 类 采集 的 经 济 成 本 是 4 元, 时间 是 1min, 则 采集 成 本 为 加 权 平 
均 (4 十 1)/2 二 2.5; 语音 类 采集 的 经 济 成 本 是 2 元 ,时间 是 2min, 则 采集 成 本 为 加 权 平 均 
(2 十 2)/2 一 2。 根据 采 集成 本 从 低 到 高 对 类 别 进行 排序 ,得 到 3 类 已 排序 的 类 别 T, 图像 
类 、T, 语音 类 、T, 指纹 类 。 

(5) 步骤 S5, 初 始 化 i 二 1, 待 识别 身份 用 户 的 最 优 输出 标签 L 二 如 ,最 大 相似 度 相 对 比 
值 U=0; 其 中 i 为 自然 数 . 取 值 范围 为 1<i<N。 

(6) 步骤 S6 ,获取 一 个 待 识别 身份 用 户 的 T 图 像 类 测试 输入 数据 ,将 其 作为 TT, 图 像 
类 深度 学 习 模 型 的 输入 ,通过 Ti 图 像 类 深度 学 习 模 型 计算 得 到 Ti 类 测试 输出 标签 Li , 例 
如 “ 张 三 身份 证 号 ”, 而 当前 最 优 输出 标签 二 如 , 则 执行 步骤 S7。 

(7) 步骤 S7 ,获取 T, 头像 类 相似 度 相对 比值 Di 。 从 头像 类 训练 输入 数据 集中 搜索 出 
预期 输出 标签 与 头像 类 测试 输出 标签 Li* 张 三 身份 证 号 ”匹配 的 头像 类 训练 输入 数据 集 , 作 
为 头像 类 第 一 训练 输入 数据 集 ; 计算 头像 类 第 一 训练 输入 数据 集中 每 一 训练 输入 数据 与 头 
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像 类 测试 输入 数据 之 间 的 相似 度 ( 例 如 ,分 别 为 70 上 686% 44% .24% 78% 98%) ,将 其 中 
最 大 相似 度 98 凶 与 头像 类 相似 度 预 设 阔 值 (例如 ,为 82%) 的 比值 作为 头像 类 相似 度 相 
对 比值 , 则 Ul 二 1. 19。 

(8) 步骤 S8, 因 U >U, 则 将 最 优 输 出 标签 工 设置 为 T, 头像 类 输出 标签 “ 张 三 身份 证 
号 ”, 将 最 大 相似 度 相 对 比值 U 设置 为 T, 图 像 类 相似 度 相 对 比值 Ui, 即 U=1. 19。 

(9) 步骤 S9 ,假设 预 设 最 大 相似 度 相 对 比值 c==1.2, 因 Uc, 则 判别 i 与 N 之 间 的 关 
系 ,由 i 二 1、.N==3 得 i<N, 则 将 i 加 1 并 返回 步 又 S6 继续 执行 。 具体 步 又 为 : 

由 上 可 知 i=2, 获 取 一 个 待 识别 身份 用 户 的 Te 语音 类 测试 输入 数据 ,将 其 作为 Ts 语 
类 深度 学 习 模 型 的 输入 ,通过 T 语音 类 深度 学 习 模型 计算 得 到 T 类 测试 输出 标签 i bin 
“ 张 三 身份 证 号 ”, 而 当前 最 优 输出 标签 工 为 “ 张 三 身 份 证 号 ”, 工 与 L; 相同 , 则 执行 如 下 步骤 ， 

获取 Ts 语音 类 相似 度 相 对 比值 U: 。 从 语音 类 训练 输入 数据 集中 搜索 出 预期 输出 标签 
与 语音 类 测试 输出 标签 L,“ 张 三 身份 证 号 ”匹配 的 语音 类 训练 输入 数据 集 , 作 为 语音 类 第 一 
训练 输入 数据 集 ; 计算 语音 类 第 一 训练 输入 数据 集中 每 一 训练 输入 数据 与 语音 类 测试 输入 
ne 分 别 为 52%、64%、78%、74%、68%) ,将 其 中 最 大 相似 度 78% 与 

音 类 相似 度 预 设 阔 值 (例如 ,为 78%%) 的 比值 作为 T, 语音 类 相似 度 相 对 比值 , 则 U, 二 1。 

因 U, 二 U, 则 保持 最 优 输出 标签 L“ 张 三 身份 证 号 ”、 最 大 相似 度 相 对 比值 U = 1. 19 
不 变 。 

因 U<c, 则 判别 i 与 N 之 间 的 关系 ,由 i 二 2、.N=3 得 i 二 N, 则 将 i 加 1 并 返回 步 又 S6 
继续 执行 。 具 体 步 又 为 : 

由 上 可 知 ;一 3, 获 取 一 个 待 识 别 身份 用 户 的 Ts 指纹 类 测试 输入 数据 ,将 其 作为 T, 指 
纹 类 深度 学 习 模型 的 输入 ,通过 Ts 指纹 类 深度 学 习 模型 计算 得 到 T; 类 测试 输出 标签 人 
例如 * 李 四 身份 证 号 ”, 而 当前 最 优 输 出 标签 L ON KS OES”. LL, 不 相同 , 则 执行 
如 下 步骤 ， 

首先 获取 Ts 指纹 类 相似 度 相 对 比值 Us 。 从 指纹 类 训练 输入 数据 集中 搜索 出 预期 输出 
标签 与 指纹 类 测试 输出 标签 L,“ 李 四 身份 证 号 ?匹配 的 指纹 类 训练 输入 数据 集 , 作 为 指纹 类 
第 一 训练 输入 数据 集 , 计 算 其 中 每 一 训练 输入 数据 与 指纹 类 测试 输入 数据 之 间 的 相似 度 ( 例 
如 为 87% ) ,将 其 中 最 大 相似 度 87 池 与 指纹 类 相似 度 预 设 阔 值 (例如 为 70%%) 的 比值 作为 Ts 
指纹 类 相似 度 相 对 比值 , 则 Us =1. 24。 

然后 判断 是 身份 识别 失败 还 是 执行 步骤 S8, 见 图 1-9。 从 指纹 类 训练 输入 数据 集中 搜 
索 出 预期 输出 标签 与 当前 最 优 输出 标签 “ 张 三 身 份 证 号 ”匹配 的 指纹 类 训练 输入 数据 集 , 作 
为 指纹 类 第 二 训练 输入 数据 集 , 计 算 其 中 每 一 训练 输入 数据 与 第 一 训练 输入 数据 集中 每 一 
训练 输入 数据 之 间 的 相似 度 ( 例 如 ,分 别 为 46%、73%、58%、……: 、89%、62%) ,如 果 其 中 最 
大 相似 度 89%% 小 于 指纹 类 混淆 相似 度 预 设 阔 值 , 则 识别 验证 失败 (例如 ,如 果 指 纹 类 混淆 相 
似 度 预 设 阔 值 是 90% ,那么 张 三 与 李 四 对 应 指纹 类 训练 输入 数据 集 的 最 大 相似 度 89% 小 于 
指纹 类 混淆 相似 度 预 设 阔 值 90 站 ,说 明 张 三 的 指纹 与 李 四 的 不 够 相似 ,而 测试 输出 的 结果 
是 张 三 、 李 四 ,这 是 矛盾 的 ,那么 就 可 能 是 用 户 在 伪造 输入 数据 ,所 以 识别 验证 失败 ); 如 果 
其 中 最 大 相似 度 大 于 等 于 指纹 类 混淆 相似 度 预 设 阔 值 , 则 执行 步骤 S8( 例 如 ,如 果 指 纹 类 混 
消 相 似 度 预 设 阔 值 是 88% ,那么 张 三 与 李 四 对 应 指纹 类 训练 输入 数据 集 的 最 大 相似 度 89% 
小 于 指纹 类 混淆 相似 度 预 设 阔 值 88% ,说 明 张 三 的 指纹 与 李 四 的 足够 相似 ,而 测试 输出 的 
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结果 是 张 三 、 李 四 ,有 可 能 是 因为 两 者 相似 导致 的 误 判 ,所 以 需要 继续 增加 其 他 类 的 输入 数 
据 进一步 识别 ) 。 假 设 上 述 判 断 结 果 为 执行 步骤 S8, 则 执行 如 下 : 因 U; 二 U, 则 将 最 优 输出 
标签 二 设置 为 T; 指纹 类 输出 标签 “ 李 四 身 份 证 号 ”, 将 最 大 相似 度 相对 比值 U 设置 为 指 
纹 类 相似 度 相对 比值 U: , 即 U=1. 24。 
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图 1-9 基于 深度 学 习 模 型 的 身份 识别 方法 中 判别 身份 识别 失败 
还 是 更 新 最 优 输出 标签 和 最 大 相似 度 相 对 比值 的 流程 


因为 Uc, 则 身份 识别 成 功 , 将 最 优 输出 标签 " 李 四 身 份 证 号 ”作为 识别 出 的 身份 标签 。 

综 上 技术 方案 可 知 , 深 度 学 习 模型 已 经 事先 通过 训练 输入 数据 训练 好 了 ,所 以 在 身份 识 
别 时 只 需要 输入 测试 输入 数据 ,就 能 通过 深度 学 习 模 型 实时 计算 得 到 输出 标签 ,从 而 运算 速 
度 要 比 传统 身份 识别 方式 “将 测试 输入 数据 与 所 有 海量 (例如 ,1000 个 用 户 身 份 可 能 对 应 10 
万 个 样本 ) 训 练 数据 一 一 匹配 (需要 匹配 10 万 次 ) ,将 最 匹配 的 训练 数据 对 应 的 标签 作为 输 
出 标签 ” 快 得 多 。 但 深度 学 习 模 型 的 输出 标签 也 不 一 定 100% 准 确 , 此 时 在 训练 数据 中 搜索 
出 该 深度 学 习 模 型 的 输出 标签 对 应 的 训练 数据 (根据 标签 检索 速度 非常 快 ,而 一 个 输出 标签 
对 应 的 一 个 用 户 的 训练 数据 比较 少 , 例 如 100 个 左右 ) 与 测试 数据 进行 比较 ,来 判断 深度 学 
习 模 型 的 输出 标签 是 否 准确 。 这 种 方式 计算 速度 快 ,又 结合 了 深度 学 习 模 型 和 传统 模式 匹 
配 的 各 自 优势 ,使 得 深度 学 习 模 型 输出 标签 的 准确 性 有 了 评价 的 标准 。 

不 同类 别 输入 数据 相似 度 的 阔 值 标准 是 不 同 的 ,例如 图 像 之 间 的 相似 度 预 设 阔 值 是 
90% ,达到 这 个 相似 度 阅 值 就 表明 这 两 个 图 像 非常 像 ,可 以 认为 是 可 能 对 应 同一 个 身份 标签 
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了 ; 而 语音 之 间 的 相似 度 预 设 阔 值 是 80% 即 可 ,因为 语音 的 噪声 相对 大 些 , 达 到 80% 的 相 
似 度 预 设 阔 值 就 表明 这 两 个 语音 非常 像 , 可 以 认为 是 可 能 对 应 同一 个 身份 标签 了 。 

而 将 每 一 类 最 大 相似 度 与 该 类 相似 度 预 设 阔 值 的 比值 作为 该 类 最 大 相似 度 相 对 比值 之 
后 ,不 同类 的 最 大 相似 度 相对 比值 就 可 以 相互 比较 了 ,因为 已 经 通过 除 以 该 类 相似 度 预 设 阔 
值 进行 归 一 化 了 。 例 如 ,图 像 最 大 相似 度 相对 比值 与 语音 最 大 相似 度 相对 比值 就 可 以 比较 ， 
越 大 表明 其 对 应 的 输出 身份 标签 越 准 确 。 所 以 如 果 当 前 最 大 相似 度 相 对 比值 大 于 预 设 最 大 
相似 度 相 对 比值 (例如 1.2), 则 身份 识别 就 成 功 ,那么 就 无 须 继续 输入 其 他 类 别 的 测试 输入 
数据 了 ,节省 了 测试 的 成 本 和 用 户 的 时 间 ,使 得 身份 识别 更 为 低 成 本 且 高 效 。 


1.3.2 基于 深度 学 习 模 型 的 身份 识别 系统 


一 种 基于 深度 学 习 模型 的 身份 识别 系统 如 图 1-10 所 和 输入 数据 获取 模块 ! 
示 , 包 括 输入 数据 获取 模块 ,初始 化 神经 网 络 模块 .训练 模 


块 、 排 序 模块 .初始 化 起 始 识别 条 件 模块 、 测 试 输出 标签 获 初始 化 神经 网 络 模块 2 
取 模块 .最 优 输出 标签 判别 模块 .相似 度 相对 比值 获取 及 判 i 
别 模块 .数据 更 新 模块 身份 识别 判定 模块 。 ii 
ee 1, 获 取 用 于 身份 识别 的 N 类 — 
DA . 
(2) 初始 化 神经 网 络 模块 2, 如 图 1-11 所 示 , 用 于 初始 TEER 
化 N 类 输入 数据 对 应 的 N 类 深度 学 习 模 型 。 具 体 包括 : 模块 5 
D 初始 化 输入 格式 单元 2-1, 用 于 初始 化 每 一 类 深度 I 
学 习 模型 的 输入 格式 为 对 应 类 的 输入 数据 的 格式 ; aie a 
@ 初始 化 输出 格式 单元 2-2, 用 于 初始 化 每 一 类 深度 
学 习 模 型 的 输出 格式 为 用 户 身份 信息 的 格式 。 RamaRe 
(3) 训练 模块 3, 如 图 1-12 所 示 , 用 于 对 N 类 深度 学 习 判别 模块 7 
模型 进行 训练 。 具 体 包括 : 
® 无 监督 训练 单元 3-1, 用 于 获取 N 类 中 每 一 类 训练 A 
输入 数据 ,并 将 每 一 类 训练 输入 数据 作为 该 类 对 应 的 深度 
学 习 模 型 的 输入 ,进行 自 下 而 上 的 无 监督 训练 ; ! 
@ 有 监督 训练 单元 3-2, 用 于 获取 N 类 中 每 一 类 带 有 ssi 
标签 的 训练 输入 数据 及 其 对 应 的 预期 输出 标签 ,并 将 其 分 
别 作 为 该 类 对 应 的 深度 学 习 模 型 的 输入 数据 与 预期 输出 标 身份 识别 判定 模块 10 


签 ,进行 自 顶 向 下 的 有 监督 训练 。 

(4) 排序 模块 4, 用 于 将 N 类 输入 数据 依据 采集 成 本 
从 低 到 高 进行 排序 。 

(5) 初始 化 起 始 识别 条 件 模块 5, 用 于 初始 化 i 二 1, 待 识别 身份 用 户 的 最 优 输出 标签 
LL 二 所, 最 大 相似 度 相对 比值 U=0. 


图 1-10 基于 深度 学 习 模型 的 身 
份 识别 系统 结构 框图 


B26 数据 处 理 与 深度 学 习 | 


无 监督 训练 
初始 化 输入 单元 3-1 
格式 单元 2-1 | 
初始 化 输出 有 监督 训练 
格式 单元 2-2 单元 3-2 
图 1-11 基于 深度 学 习 模型 的 身份 识别 系统 中 图 1-12 基于 深度 学 习 模 型 的 身份 识别 
初始 化 神经 网 络 模 块 的 结构 框图 系统 中 训练 模块 的 结构 框图 


(6) 测试 输出 标签 获取 模块 6, 用 于 将 一 个 待 识别 身份 用 户 的 T; 类 测试 输入 数据 作为 
T; 类 深度 学 习 模 型 的 输入 ,通过 T; 类 深度 学 习 模 型 计算 得 到 T,; 类 测试 输出 标签 志 ;。 

(7) 最 优 输 出 标签 判别 模块 7, 用 于 判断 最 优 输出 标签 L 是 否 为 空 或 与 了 , 类 测试 输出 
m% L; 相同 。 

(8) 相似 度 相 对 比值 获取 及 判别 模块 8 如 图 1-13 所 示 , 用 于 获取 T; 类 相似 度 相对 比 
值 U;, 并 判别 直接 执行 下 一 模块 还 是 需要 进一步 判别 是 否 身份 识别 失败 后 再 执行 下 一 模 
Se. 具体 包 括 : 


也 类 第 一 训练 输入 


了 类 第 二 训练 输入 


数据 集 获 取 单 元 8-|| 。 | 数据 集 获取 单元 8 
pepe eas 判别 单元 8-4 


图 1-13 基于 深度 学 习 模型 的 身份 识别 系统 中 相似 度 相 对 比值 获取 及 判别 模块 的 结构 框图 


Q@ T 类 第 一 训练 输入 数据 集 获取 单元 8-1, 用 于 从 T; 类 训练 输入 数据 集中 搜索 预期 
标签 与 了, 类 测试 输出 标签 志 ; 匹配 的 T; 类 训练 输入 数据 集 ,将 其 作为 T; 类 第 一 训练 输入 
数据 集 ; 

© T; 类 第 二 训练 输入 数据 集 获取 单元 8-2. 用 于 从 T; 类 训练 输入 数据 集中 搜索 预期 
标签 与 最 优 输 出 标签 工 匹配 的 T; 类 训练 输入 数据 集 ,将 其 作为 T; 类 第 二 训练 输入 数 
据 集 ; 

@ T; 类 相似 度 相对 比值 U; 获取 单元 8-3, 用 于 计算 T; 类 第 一 训练 输入 数据 集中 每 一 
训练 输入 数据 与 T, 类 测试 输入 数据 的 相似 度 , 将 其 中 最 大 的 相似 度 M; GT 类 测试 相似 
度 预 设 阔 值 w; 的 比值 作为 T; 类 相似 度 相 对 比值 U;; 

QD 判别 单元 8-4, 用 于 依据 最 优 输出 标签 判别 模块 的 结果 ,判别 是 直接 执行 下 一 模块 还 
是 需要 进一步 判别 是 否 身份 识别 失败 后 再 执行 下 一 模块 。 

(9) 数据 更 新 模块 9, 用 于 依据 T; 类 相似 度 相对 比值 U; 与 最 大 相似 度 相对 比值 U 之 
间 的 关系 ,更 新 最 优 输 出 标签 L 和 最 大 相似 度 相对 比值 U。 

(10) 身份 识别 判定 模块 10, 用 于 依据 最 大 相似 度 相 对 比值 U 与 预 设 最 大 相似 度 相 对 
比值 c 之 间 的 关系 \i 与 N 之 间 的 关系 .判定 身份 识别 是 成 功 、 失 败 还 是 i 加 1 返回 测试 输出 
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标签 获取 模块 继续 执行 。 

本 技术 方案 与 现 有 技术 相 比 ,其 显著 优点 为 : 本 技术 方案 通过 训练 多 类 深度 学 习 模 型 ， 
在 对 用 户 进行 身份 识别 时 ,优先 选择 低 成 本 的 测试 数据 。 本 技术 方案 先 以 一 种 类 型 的 测试 
输入 数据 进行 判别 .如果 判 别 不 出 用 户 的 身份 , 则 逐渐 增加 其 他 类 型 的 测试 输入 数据 进行 判 
别 , 从 而 在 最 低 成 本 的 情况 下 取得 最 高 的 判别 准确 率 。 


智能 型 深度 学 习 模 型 


将 现 有 技术 中 深度 学 习 模型 的 初始 化 环节 或 训练 环节 或 整个 环节 进行 优化 ,能 够 使 得 
深度 学 习 模 型 更 为 智能 高 效 。 本 童 给 出 了 两 种 智能 型 深度 学 习 模 型 : 基于 大 数据 的 深度 学 
习 模 型 初始 化 ,深度 学 习 模 型 进化 。 基 于 大 数据 的 深度 学 习 模 型 初始 化 方法 包括 获取 目标 
初始 化 深度 学 习 模型 的 特征 信息 ,将 特征 信息 在 预 设 深度 学 习 模 型 数据 库 中 进行 匹配 ,得 到 
匹配 结果 ,根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 ,通过 训练 数据 训练 目标 初始 化 深度 
学 习 模 型 ,得 到 深度 学 习 的 目标 深度 学 习 模 型 。 本 技术 方案 通过 特征 信息 匹配 ,将 预先 存储 
的 以 往 训练 过 的 深度 学 习 模 型 作为 将 来 深度 学 习 模 型 初始 化 的 基础 ,从 而 优化 深度 学 习 模 
型 初始 化 的 结果 ,使 得 深度 学 习 模 型 在 更 优 初始 化 的 情况 下 进行 训练 ,从 而 能 够 缩短 训练 时 
间 , 提 高 深度 学 习 模 型 的 训练 速度 ,同时 也 能 保证 深度 学 习 模型 深度 学 习 的 效果 。 深 度 学 习 
模型 进化 方法 包括 : 将 输入 数据 输入 调 取 的 已 训练 的 深度 学 习 模 型 得 到 输出 数据 ,记录 使 
用 时 间 及 获取 对 应 的 真实 结果 数据 ; 按照 预 设 的 抽查 规则 选取 使 用 过 程 中 的 输入 数据 、 输 
出 数据 、 使 用 时 间 和 真实 结果 数据 ; 将 选取 的 输入 数据 及 对 应 的 输出 数据 ,真实 结果 数据 和 
使 用 时 间 组 成 数据 组 ; 计算 数据 组 中 输出 数据 与 真实 结果 数据 的 差异 值 , 统 计 预 设 时间 段 
内 所 有 数据 组 中 差异 值 大 于 预 设 阔 值 的 组 数 ; 若 组 数 大 于 或 等 于 存储 的 组 数 阔 值 , 根 据 差 
异 组 的 输入 数据 和 真实 结果 数据 对 已 训练 的 深度 学 习 模型 进行 训练 得 到 进化 后 的 深度 学 习 
模型 。 如 此 可 纠正 深度 学 习 模 型 的 偏差 ,提高 准确 率 。 


2.1 基于 大 数据 的 深度 学 习 模型 初始 化 


深度 学 习 模型 作为 对 人 脑 最 简单 的 一 种 抽象 和 模拟 ,是 模仿 人 的 大 脑 神经 系统 信息 处 
理 功能 的 一 个 人 工 智能 化 系统 。 深 度 学 习 模型 是 以 数学 和 物理 方法 以 及 信息 处 理 的 角度 对 
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人 脑 深 度 学 习 模 型 进行 抽象 ,并 建立 某 种 简化 模型 , 旨 在 模仿 人 脑 结构 及 其 功能 的 信息 处 理 
系统 。 深 度 学 习 模型 最 有 吸引 力 的 特点 就 是 它 的 学 习 能 力 , 其 中 ,深度 学 习 本 质 上 是 一 种 采 
用 多 层 非 线性 变换 的 信息 提取 方法 ,通过 无 监督 或 有 监督 训练 得 出 一 组 能 够 提取 数据 丰富 
内 涵 的 网 络 参数 ,最终 用 于 特征 提取 或 转换 以 及 模式 分 类 等 任务 。 

传统 深度 学 习 模 型 的 初始 化 都 是 对 深度 学 习 模 型 随机 地 赋予 初 值 或 按照 与 待 训练 数据 
无 关 的 规则 赋予 初 值 ,然后 进行 学 习 训练 ,最 终 获 得 网 络 模型 " 汶 。 然 而 ,通过 随机 赋予 初 
值 训练 成 符合 训练 样本 数据 的 权 值 需要 很 长 时 间 ,效率 较 低 ,对 于 结构 复杂 、 层 数 多 的 深度 
学 习 模型 来 说 尤其 如 此 。 

本 技术 研究 并 给 出 了 一 种 新 的 深度 学 习 模型 深度 学 习 方 法 .系统 .计算 机 可 读 存储 介质 
和 计算 机 设备 。 


2.1.1 基于 大 数据 的 深度 学 习 模 型 初始 化 方法 


1. 基于 大 数据 的 深度 学 习 模型 初始 化 的 基本 方法 
深度 学 习 模型 深度 学 习 方法 的 流程 示意 图 如 图 2-1 所 示 ,本 技术 方案 中 的 深度 学 习 模 
型 深度 学 习 方法 包括 ， 


sl 

a 
获取 目标 初始 化 深度 学 习 模 型 的 特征 信息 

| 2 S2 


将 目标 初始 化 深度 学 习 模型 的 特征 信 ， 息 在 预 设 
采 度 学 习 模型 数据 库 中 进行 匹配 ， 得 到 匹配 结 


\ il 


根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 


S4 

| fe 

通过 训练 数据 训练 目标 初始 化 深度 学 习 模型 ， 得 
到 深度 学 习 的 目标 深度 学 习 模型 


图 2-1 深度 学 习 模型 深度 学 习 方 法 的 流程 示意 图 


(1) 步骤 S1 ,获取 目标 初始 化 深度 学 习 模 型 的 特征 信息 

具体 步骤 为 ， 根据 需要 构建 的 目标 初始 化 深度 学 习 模 型 确定 其 特征 信息 ,特征 信息 可 
以 为 描述 该 深度 学 习 模 型 的 参数 ,如 目标 初始 化 深度 学 习 模 型 的 应 用 信息 ,应 用 信息 可 以 包 
括 训 练 数据 的 格式 ,例如 图 片 格式 .是 否 类 标签 等 ; 应 用 的 功能 ,例如 人 脸 识别 .语音 识别 
等 。 具体 而 言 ,例如 ,需要 初始 化 一 个 用 于 人 脸 识别 的 深度 学 习 模 型 ,该 深度 学 习 模 型 训练 
数据 的 输入 是 图 像 数据 ,输出 是 标签 "是 人 脸 ”“ 不 是 人 脸 ”, 那 么 此 时 该 目标 初始 化 深度 学 习 
模型 的 特征 信息 就 是 : 训练 数据 的 输入 格式 为 “图 片 格式 ”, 输 出 格式 “是 否 类 标签 ”, 功 能 为 
“人 脸 识别 ”。 
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(2) 步骤 S2 ,将 目标 初始 化 深度 学 习 模型 的 特征 信息 在 预 设 深度 学 习 模型 数据 库 中 进 
行 匹配 ,得 到 匹配 结果 。 

在 获得 目标 初始 化 深度 学 习 模 型 的 特征 信息 后 ,连接 预 设 的 深度 学 习 模型 数据 库 ,该 深 
度 学 习 模 型 数据 库 包括 预先 采集 的 各 种 深度 学 习 模 型 的 大 数据 ,可 以 包括 已 训练 并 实用 的 
深度 学 习 模型 ,还 可 以 包括 部 分 训练 的 深度 学 习 模 型 。 例 如 ,可 以 包括 用 于 人 脸 识别 、 指 纹 
识别 .汉语 识别 .英语 识别 等 各 种 已 训练 的 深度 学 习 模型 。 相 应 的 ,深度 学 习 模型 数据 库 中 
的 各 种 深度 学 习 模型 也 设 有 其 对 应 的 特征 信息 。 根 据 目 标 初始 化 深度 学 习 模 型 的 特征 信息 
在 预 设 深度 学 习 模型 数据 库 中 与 各 深度 学 习 模型 对 应 的 特征 信息 进行 搜索 匹配 ,得 到 匹配 
结果 。 在 具体 应 用 时 ,可 以 在 匹配 结果 中 选择 匹配 程度 最 高 的 特征 信息 对 应 的 已 训练 深度 
学 习 模 型 ,从 而 获得 与 目标 初始 化 深度 学 习 模 型 的 特征 信息 相似 度 最 高 的 最 优 已 训练 深度 
学 习 模 型 。 

(3) 步骤 S3, 根 据 匹 配 结果 确定 目标 初始 化 深度 学 习 模 型 。 

根据 目标 初始 化 深度 学 习 模 型 的 特征 信息 在 预 设 的 深度 学 习 模 型 数据 库 中 搜索 匹配 的 
结果 ,确定 目标 初始 化 深度 学 习 模型 。 可 以 将 匹配 结果 中 匹配 程度 最 高 的 特征 信息 对 应 的 
已 训练 深度 学 习 模 型 作为 目标 初始 化 深度 学 习 模 型 。 匹 配 结果 中 匹配 程度 最 高 的 已 训练 深 
度 学 习 模 型 ,其 特征 信息 与 目标 初始 化 深度 学 习 模型 的 特征 信息 匹配 程度 最 高 ,说 明 二 者 深 
度 学 习 模型 的 各 项 参数 也 最 相关 ,直接 将 其 作为 该 目标 初始 化 深度 学 习 模 型 ,可 以 在 保证 初 
始 化 结果 准确 性 的 前 提 下 , 极 大 缩短 目标 深度 学 习 模型 的 初始 化 时 间 , 优 化 深度 学 习 模 型 初 
始 化 的 结果 ,从 而 能 够 缩短 训练 时 间 ,提高 深度 学 习 模型 的 训练 速度 。 

(4) 步骤 S4, 通 过 训练 数据 训练 目标 初始 化 深度 学 习 模 型 ,得 到 深度 学 习 的 目标 深度 
学 习 模型 。 

获得 目标 初始 化 深度 学 习 模型 后 ,基于 该 目标 初始 化 深度 学 习 模型 通过 训练 数据 进行 
训练 ,得 到 深度 学 习 的 目标 深度 学 习 模 型 。 具 体 步 骤 为 : 通过 训练 数据 对 搜索 匹配 确定 的 
目标 初始 化 深度 学 习 模 型 进行 训练 时 ,可 以 利用 训练 数据 中 的 输入 数据 对 目标 初始 化 深度 
学 习 模 型 进行 无 监督 训练 ,再 利用 训练 数据 中 的 输入 数据 及 其 对 应 的 输出 数据 对 目标 初始 
化 深度 学 习 模型 进行 有 监督 训练 ,从 而 相当 于 对 已 一 次 训练 过 的 已 训练 深度 学 习 模 型 依据 
目标 深度 学 习 模 型 的 需求 进行 二 次 训练 ,得 到 深度 学 习 的 目标 深度 学 习 模 型 。 

上 述 深度 学 习 模型 深度 学 习 方 法 ,根据 获取 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 在 
预先 构建 的 深度 学 习 模 型 数据 库 中 进行 匹配 ,根据 该 匹配 的 结果 确定 所 需 的 目标 初始 化 深 
度 学 习 模 型 ,并 通过 训练 数据 对 其 继续 进行 训练 ,最 后 得 到 深度 学 习 的 目标 深度 学 习 模 型 。 
本 技术 方案 通过 特征 信息 匹配 ,将 预先 存储 的 以 往 训练 过 的 深度 学 习 模型 作为 将 来 深度 学 
习 模 型 初始 化 的 基础 ,从 而 优化 深度 学 习 模 型 初始 化 的 结果 ,使 得 深度 学 习 模 型 在 更 优 初始 
化 的 情况 下 进行 训练 ,从 而 能 够 缩短 训练 时 间 , 提 高 深度 学 习 模 型 的 训练 速度 ,同时 也 能 保 
证 深度 学 习 模型 深度 学 习 的 效果 。 

特征 信息 可 以 包括 网 络 标 签 ,数据 格式 和 网 络 功 能 中 的 至 少 一 种 。 

特征 信息 用 于 描述 目标 初始 化 深度 学 习 模型 。 特 征 信息 可 以 包括 一 个 或 多 个 参数 ,如 
可 以 包括 网 络 标签 .数据 格式 和 网 络 功能 中 的 至 少 一 种 。 网 络 标签 可 以 包括 是 否 类 标签 、 真 
假 类 标签 等 ; 数据 格式 可 以 包括 图 像 、 文 本 、 音 频 等 格式 ; 网 络 功能 描述 深度 学 习 模 型 的 功 
能 应 用 ,如 “用 于 人 脸 识 别 “ 用 于 指纹 识别 “用 于 汉语 识别 “用 于 英语 识别 ”等 功能 应 用 。 
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当 特 征 信 息 包括 多 个 参数 时 ,可 以 根据 目标 初始 化 深度 学 习 模 型 的 实际 需求 ,为 特征 信息 的 
各 参数 设 定 优先 级 。 如 当 特 征 信息 包括 网 络 标签 ,数据 格式 和 网 络 功能 时 , 设 定 网 络 功能 为 
高 级 参数 ,数据 格式 为 中 级 参数 ,网 络 标签 为 低级 参数 ,那么 当 进行 特征 信息 匹配 时 ,优先 匹 
配 优先 级 高 的 参数 ,其 次 匹配 优先 级 低 的 参数 ,从 而 能 够 有 效 地 加 快 在 深度 学 习 模 型 数据 库 
中 的 搜索 匹配 效率 。 如 特征 信息 包括 : 网 络 标签 为 “是 否 类 标签 ”, 数 据 格式 为 “图 片 格式 ” 
以 及 网 络 功 能 为 * 人 脸 识 别 ”, 那 么 在 特征 信息 匹配 时 ,优先 匹配 网 络 功 能 为 * 人 脸 识别 ”的 深 
度 学 习 模 型 ,其 次 匹配 数据 格式 为 “图 片 格式 ”的 深度 学 习 模 型 ,最 后 匹配 网 络 标 签 为 “是 否 
类 标签 ”的 深度 学 习 模 型 。 

2. 基于 大 数据 的 深度 学 习 模型 初始 化 的 详细 方法 

图 2-2 为 另 一 个 技术 方案 中 深度 学 习 模 型 深度 学 习 方法 的 流程 示意 图 , 相 比 于 图 2-1 
的 技术 方案 ,本 技术 方案 将 目标 初始 化 深度 学 习 模型 的 特征 信息 在 预 设 深度 学 习 模型 数据 
库 中 进行 匹配 ,得 到 匹配 结果 的 步骤 包括 : 

一 Si 

获取 目标 初始 化 深度 学 习 模 型 的 特征 信息 


os! 


查询 
预 设 的 深度 学 习 模型 数据 库 ， 深 度 学 习 模 型 数据 
模型 


库存 储 有 已 训练 的 深度 学 习 相 


1 2-2 
将 目标 初始 化 深度 学 习 模型 的 特征 信息 与 已 训练 的 
深度 学 习 模型 的 特征 信息 进行 匹配 ， 得 到 匹配 结果 


ya 
根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 


2 ee 
通过 训练 数据 训练 目标 初始 化 深度 学 习 模型 ， 
得 到 深度 学 习 的 目标 深度 学 习 模型 


图 2-2 深度 学 习 模型 深度 学 习 方 法 的 流程 示意 图 


步 又 S2-1 ,查询 预 设 的 深度 学 习 模 型 数据 库 , 其 中 存储 有 已 训练 深度 学 习 模 型 。 

深度 学 习 模 型 数据 库 包括 预先 采集 的 各 种 已 训练 深度 学 习 模 型 的 大 数据 。 在 获取 预 设 
的 深度 学 习 模 型 数据 库 之 前 还 可 以 包括 : 构建 深度 学 习 模 型 数据 库 , 其 中 存储 有 已 训练 深 
度 学 习 模型 。 构 建 深度 学 习 模 型 数据 库 可 以 通过 采集 各 种 已 训练 的 深度 学 习 模 型 来 实现 ， 
其 中 ,已 训练 的 深度 学 习 模 型 也 设 有 相应 的 特征 信息 。 

深度 学 习 模 型 数据 库 包括 各 种 已 训练 深度 学 习 模型 ,例如 ,对 于 人 脸 识 别 的 深度 学 习 模 
型 ,其 训练 数据 的 输入 /输出 格式 会 有 多 种 ,输入 格式 可 以 是 高 分 辩 率 的 图 像 格式 .中 分 辩 率 
的 图 像 格 式 ,也 可 以 是 低 分 辩 率 的 图 像 格式 ; 输出 格式 可 以 是 “是 / 否 ” 标 签 “ 否 /是 男人 ” 标 
签 , 也 可 以 是 “ 否 /是 女人 ”标签 ,还 可 以 是 “ 否 / 是 男人 /是 女人 ”标签 ; 应 用 功能 可 以 是 识别 
人 脸 .识别 男人 人 脸 , 还 可 以 是 识别 女人 人 脸 , 还 可 以 是 识别 男人 和 女人 人 脸 。 以 此 ,根据 各 
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已 训练 的 深度 学 习 模 型 的 特征 信息 可 以 细 分 出 各 种 已 训练 的 子 深度 学 习 模 型 ,并 构建 出 一 
对 于 人 脸 识 别 的 深度 学 习 模 型 子 数据 库 , 多 种 子 深 度 学 习 模 型 子 数据 库 进 一 步 组 成 深度 学 
习 模型 数据 库 。 

步骤 S2-2 ,将 目标 初始 化 深度 学 习 模 型 的 特征 信息 与 已 训练 深度 学 习 模 型 的 特征 信息 
进行 匹配 ,得 到 匹配 结果 。 

获取 预 设 的 深度 学 习 模型 数据 库 后 ,将 目标 初始 化 深度 学 习 模 型 的 特征 信息 与 深度 学 
习 模型 数据 库 中 各 已 训练 深度 学 习 模型 的 特征 信息 进行 匹配 。 特 征 信息 进行 匹配 时 ,可 以 
一 一 匹配 ,也 可 以 通过 设计 匹配 优先 级 来 加 快 搜索 匹配 。 当 特征 信息 包括 多 个 参数 时 ,可 以 
根据 目标 初始 化 深度 学 习 模型 的 实际 需求 ,为 特征 信息 的 各 参数 设 定 优先 级 , 当 进 行 特征 信 
息 匹 配 时 ,优先 匹配 优先 级 高 的 参数 ,其 次 匹配 优先 级 低 的 参数 ,从 而 能 够 有 效 地 加 快 在 深 
度 学 习 模型 数据 库 中 的 搜索 匹配 效率 。 特 征 信息 进行 匹配 后 ,获得 各 匹配 结果 。 可 以 将 各 
匹配 结果 进行 排序 ,以 便 后 续 对 匹配 结果 进行 处 理 。 

将 目标 初始 化 深度 学 习 模 型 的 特征 信息 与 已 训练 深度 学 习 模 型 的 特征 信息 进行 匹配 ， 
得 到 匹配 结果 的 步骤 可 以 通过 以 下 形式 进行 : 

D 获取 已 训练 深度 学 习 模型 的 特征 信息 ; 

@ 获取 预 设 的 特征 信息 匹配 规则 ,其 中 包括 匹配 优先 级 ; 

@ 根据 匹配 优先 级 ,将 目标 初始 化 深度 学 习 模型 的 特征 信息 与 已 训练 深度 学 习 模型 的 
特征 信息 进行 相关 度 匹 配 ,得 到 匹配 结果 。 

具体 步骤 为 : 首先 获取 已 训练 深度 学 习 模型 的 特征 信息 ,其 与 目标 初始 化 深度 学 习 模 
型 特征 信息 的 格式 相对 应 ,以 便 实现 匹配 。 获 取 预 设 的 特征 信息 匹配 规则 ,其 中 包括 匹配 优 
先 级 ,匹配 优先 级 可 以 根据 目标 初始 化 深度 学 习 模型 进行 个 性 化 配置 ,以 便 在 保证 匹配 准确 
度 的 同时 ,能 最 大 限度 地 缩短 匹配 时 间 ,提高 匹配 效率 。 特 征 信息 匹配 规则 还 可 以 包括 其 他 
依据 目标 初始 化 深度 学 习 模 型 进行 配置 的 个 性 化 匹配 规则 ,以 便 快速 准确 获得 匹配 度 最 高 
的 已 训练 深度 学 习 模 型 。 获 得 预 设 的 特征 信息 匹配 规则 后 ,根据 该 匹配 规则 将 目标 初始 化 
深度 学 习 模型 的 特征 信息 与 已 训练 深度 学 习 模型 的 特征 信息 进行 相关 度 匹 配 。 例 如 , 当 特 
征 信息 包括 网 络 标签 .数据 格式 和 网 络 功能 时 ,首先 获取 各 个 已 训练 深度 学 习 模 型 的 特征 信 
AS, ,再 获取 预 设 的 特征 信息 匹配 规则 ,特征 信息 匹配 规则 包括 的 匹配 优先 级 如 下 : 网 络 功能 
为 高 级 参数 ,数据 格式 为 中 级 参数 ,网 络 标签 为 低级 参数 。 那 么 , 当 进行 特征 信息 匹配 时 , 根 
据 该 匹配 优先 级 ,优先 匹配 网 络 功 能 ; 当 网 络 功能 匹配 相同 时 ,匹配 数据 格式 ; 当 数 据 格式 
匹配 一 致 时 ,再 匹配 网 络 标签 ,从 而 能 够 有 效 地 加 快 在 深度 学 习 模型 数据 库 中 的 搜索 匹配 
效率 。 

例如 ,一 深度 学 习 模型 数据 库 中 包括 但 不 限于 如 下 24 个 深度 学 习 模 型 : 

已 训练 深度 学 习 模 型 1 ,应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K11 的 图 像 格式 ; 
训练 数据 的 输出 格式 是 “是 /和 否 ? 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 ,K11 为 分 辩 率 数值 。 

已 训练 深度 学 习 模 型 2 ,应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K11 的 图 像 格式 ; 
训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K11 为 分 辩 率 
数值 。 

已 训练 深度 学 习 模 型 3 .应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K11 的 图 像 格式 ; 
训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,K11 为 分 辩 率 
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数值 。 

已 训练 深度 学 习 模 型 4 ,应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K11 
训练 数据 的 输出 格式 是 “是 /和 否 ? 标 签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 , 开 
数值 。 

已 训练 深度 学 习 模 型 5, 应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K12 


已 训练 深度 学 习 模 型 6, 应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辨 率 K12 
训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K 
数值 。 

已 训练 深度 学 习 模 型 7 ,应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K13 
训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,天 
数值 。 
已 训练 深度 学 习 模 型 8 ,应 用 信息 : 训练 数据 的 输入 格式 是 高 分 辩 率 K14 
训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 ,天 
数值 。 
已 训练 深度 学 习 模 型 9 ,应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辨 率 K21 


的 图 像 格式 ， 
11 为 分 辩 率 


的 图 像 格式 ; 


训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 ,K12 为 分 辩 率 数值 。 


的 图 像 格 式 ; 
12 为 分 辨 率 


的 图 像 格 式 ; 
13 为 分 辩 率 


的 图 像 格式 ; 
14 为 分 辩 率 


的 图 像 格式 ; 


训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 ,K21 为 分 辩 率 数值 。 


已 训练 深度 学 习 模 型 10 ,应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K21 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 / 否 "标签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K21 为 分 辩 率 


数值 。 
已 训练 深度 学 习 模 型 11, 应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 开 


21 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 * 是 / 否 "标签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,K21 为 分 辩 率 


已 训练 深度 学 习 模型 12 ,应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K21 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 ,K21 为 分 辨 率 


已 训练 深度 学 习 模 型 13 ,应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K22 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 , K22 为 分 辩 率 


已 训练 深度 学 习 模 型 14, 应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K22 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K22 为 分 辨 率 


已 训练 深度 学 习 模 型 15 ,应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K22 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,K22 为 分 辨 率 


已 训练 深度 学 习 模 型 16, 应 用 信息 : 训练 数据 的 输入 格式 是 中 分 辩 率 K22 的 图 像 格 


式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 ,K22 为 分 辩 率 


数值 。 


已 训练 深度 学 习 模 型 17, 应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K31 的 图 像 格 
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式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 ,K31 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 18 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K31 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K31 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 19 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K31 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,K31 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 20, 应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K31 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 /和 否 "标签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 ,K31 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 21 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K32 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 / 否 ” 标 签 ; 功能 可 以 是 识别 人 脸 。 其 中 ,K32 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 22 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K32 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 是/ 否 "标签 ; 功能 可 以 是 识别 男人 人 脸 。 其 中 ,K32 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模型 23 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K32 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 “是 / 否 " 标 签 ; 功能 可 以 是 识别 女人 人 脸 。 其 中 ,K32 为 分 辩 率 
数值 。 
已 训练 深度 学 习 模 型 24 ,应 用 信息 : 训练 数据 的 输入 格式 是 低 分 辩 率 K32 的 图 像 格 
式 ; 训练 数据 的 输出 格式 是 * 是 /和 否 "标签 ; 功能 可 以 是 识别 张 三 人 脸 。 其 中 ,K32 为 分 辩 率 
数值 。 

在 匹配 时 ,将 目标 初始 化 深度 学 习 模 型 的 特征 信息 与 深度 学 习 模 型 数据 库 中 已 训练 深 
度 学 习 模 型 1 一 24 进行 匹配 。 具 体 而 言 ,可 以 匹配 训练 数据 的 输入 格式 、 训 练 数据 的 输出 格 
式 及 网 络 功 能 等 。 

根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 可 以 通过 以 下 步骤 进行 : 

OD 将 相关 度 匹 配 的 匹配 结果 进行 排序 ; 

@ 获取 相关 度 匹 配 的 匹配 结果 中 相关 度 最 高 的 已 训练 深度 学 习 模 型 的 特征 信息 所 对 
应 的 已 训练 深度 学 习 模型 ; 

@ 将 相关 度 最 高 的 已 训练 深度 学 习 模 型 作为 目标 初始 化 深度 学 习 模型 。 

其 中 ,将 目标 初始 化 深度 学 习 模型 的 特征 信息 与 已 训练 深度 学 习 模 型 的 特征 信息 进行 
相关 度 匹 配 的 匹配 结果 进行 排序 ,如 按照 相关 度 由 高 至 低 的 顺序 进行 排序 ,根据 该 匹配 结果 
中 相关 度 最 高 的 特征 信息 获取 其 对 应 的 已 训练 深度 学 习 模 型 ,最 后 将 该 相关 度 最 高 的 已 训 
练 深度 学 习 模 型 作为 目标 初始 化 深度 学 习 模 型 。 

例如 ,对 于 上 述 深度 学 习 模 型 数据 库 , 其 至 少 包括 上 述 列 出 的 已 训练 深度 学 习 模 型 1 一 24。 
如 果 此 时 需要 待 初始 化 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 是 : 训练 数据 的 输入 输出 格 
式 为 "图 片 格式 且 分 辩 率 为 久 12 ,是否 类 标签 ”功能 为 "人 脸 识 别 ”, 则 与 从 上 述 深度 学 习 模 
型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深度 学 习 模 型 是 已 训练 深度 学 习 模 型 5， 
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将 该 模型 作为 所 需 的 目标 初始 化 深度 学 习 模 型 。 

如 果 需 要 待 初始 化 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 是 : 训练 数据 的 输入 /输出 
格式 为 “图 片 格式 且 分 辨 率 为 K32、 是 否 类 标签 ”, 功 能 为 “ 张 三 人 脸 识别 ”, 则 与 从 上 述 深度 
学 习 模 型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深度 学 习 模型 是 已 训练 深度 学 习 模 
型 24, 将 该 模型 作为 所 需 的 目标 初始 化 深度 学 习 模型 。 

当 未 搜索 匹配 到 完全 相同 对 应 的 已 训练 深度 学 习 模 型 时 ,可 以 从 匹配 结果 中 提取 相似 
度 最 高 的 特征 信息 对 应 的 已 训练 深度 学 习 模 型 ,将 其 作为 所 需 的 目标 初始 化 深度 学 习 模型 。 

例如 ,如 果 需 要 待 初始 化 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 是 : 训练 数据 的 输入 / 
输出 格式 为 “图 片 格式 且 分 辩 率 为 X1 ,是否 类 标签 ”功能 为 "人 脸 识别 ,其 中 ,X1 与 K12 
最 为 接近 , 则 与 从 上 述 深度 学 习 模 型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深度 学 
习 模 型 是 已 训练 深度 学 习 模 型 5, 那 么 将 该 模型 作为 所 需 的 目标 初始 化 深度 学 习 模 型 。 

如 果 需 要 待 初始 化 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 是 : 训练 数据 的 输入 /输出 
格式 为 "图片 格式 且 分 辩 率 为 X2、 是 否 类 标签 ”, 功 能 为 “ 张 三 人 脸 识别 ”, 其 中 ,X2 与 K32 
最 为 接近 , 则 与 从 上 述 深度 学 习 模 型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深度 学 
习 模 型 是 已 训练 深度 学 习 模 型 24, 那 么 将 该 模型 作为 所 需 的 目标 初始 化 深度 学 习 模型 。 

在 根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 后 ,通过 训练 数据 训练 该 目标 初始 化 深 
度 学 习 模 型 ,得 到 深度 学 习 的 目标 深度 学 习 模 型 ,该 模型 可 以 用 于 具体 的 应 用 中 。 例 如 ,如 
果 需 要 待 初始 化 的 目标 初始 化 深度 学 习 模型 的 特征 信息 是 : 训练 数据 的 输入 /输出 格式 为 
“图 片 格式 且 分 辩 率 为 X1 是否 类 标签 ”功能 为 "人 脸 识别 ,其 中 ,X1 与 人 12 最 为 接近 , 则 
与 从 上 述 深度 学 习 模 型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深度 学 习 模 型 是 已 训 
练 深度 学 习 模 型 5 ,那么 将 该 模型 作为 目标 初始 化 深度 学 习 模 型 ,对 其 继续 进行 训练 。 将 输 
入 /输出 格式 为 “图 片 格式 且 分 辩 率 为 X1 .是否 类 标签 的 训练 数据 输入 已 训练 深度 学 习 模 
型 5 进行 训练 ,得 到 新 的 已 训练 深度 学 习 模型 A, 则 可 应 用 已 训练 深度 学 习 模 型 A 进行 “人 
脸 识 别 ? 测 试 和 应 用 。 

再 如 ,如 果 需 要 待 初始 化 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 是 : 训练 数据 的 输入 / 
输出 格式 为 图片 格 式 且 分 辩 率 为 X2、 是 否 类 标签 ”, 功 能 为 “ 张 三 人 脸 识别 ”, 其 中 ,X2 与 
K32 最 为 接近 , 则 与 从 上 述 深度 学 习 模 型 数据 库 中 搜索 出 来 的 特征 信息 最 匹配 的 已 训练 深 
度 学 习 模 型 是 已 训练 深度 学 习 模 型 24, 那 么 将 该 模型 作为 目标 初始 化 深度 学 习 模 型 ,对 其 
继续 进行 训练 。 将 输入 /输出 格式 为 “图 片 格式 且 分 辩 率 为 X2、 是 否 类 标签 "的 训练 数据 输 
入 已 训练 深度 学 习 模型 24 进行 训练 ,得 到 新 的 已 训练 深度 学 习 模 型 B, 则 可 应 用 已 训练 深 
度 学 习 模 型 B 进行 “ 张 三 人 脸 识 别 ? 测 试 和 应 用 。 

本 技术 方案 的 深度 学 习 模 型 深度 学 习 方法 包括 : 将 深度 学 习 的 目标 深度 学 习 模 型 更 新 
至 深度 学 习 模 型 数据 库 中 。 

在 对 目标 初始 化 深度 学 习 模 型 训练 结束 ,得 到 深度 学 习 的 目标 深度 学 习 模型 后 ,将 其 更 
新 添加 至 深度 学 习 模 型 数据 库 中 ,以 及 时 扩展 深度 学 习 模 型 数据 库 , 以 便 后 续 深度 学 习 模 型 
搜索 匹配 使 用 。 

例如 ,得 到 新 的 已 训练 深度 学 习 模 型 A 后 , 则 将 其 A 及 其 特征 信息 添加 进深 度 学 习 模 
型 数据 库 中 ,已 训练 深度 学 习 模型 A 的 特征 信息 是 : 训练 数据 的 输入 /输出 格式 为 “图 片 格 
式 且 分 辨 率 为 X1 .是 否 类 标签 ”, 功 能 为 "人 脸 识 别 ”。 
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又 如 ,得 到 新 的 已 训练 深度 学 习 模 型 B 后 , 则 将 其 及 其 特征 信息 添加 进深 度 学 习 模 型 
数据 库 ,已 训练 深度 学 习 模型 B 的 特征 信息 是 : 训练 数据 的 输入 /输出 格式 为 “图 片 格式 且 
分 辨 率 为 X2 .是 否 类 标签 ”, 功 能 为 " 张 三 人 脸 识 别 ”。 

如 此 ,后 续 目 标 初始 化 深度 学 习 模 型 的 特征 信息 如 果 为 “训练 数据 的 输入 /输出 格式 为 
“图 片 格式 且 分 辩 率 为 X1 .是否 类 标签 ”, 功 能 为 "人 脸 识 别 ”? 或 “训练 数据 的 输入 /输出 格式 
为 “图 片 格式 且 分 辩 率 为 X2 ,是否 类 标签 ,功能 为 * 张 三 人 脸 识别 ”时 ,可 以 快速 准确 地 匹 
配 得 到 已 训练 深度 学 习 模型 A 或 B, 并 作为 新 的 目标 初始 化 深度 学 习 模型 ,而 不 需要 再 重 
新 以 随机 赋予 初 值 的 方式 进行 初始 化 ,能 够 优化 深度 学 习 模 型 初始 化 的 结果 ,从 而 缩短 训练 
时 间 ,提高 深度 学 习 模型 的 训练 速度 ,同时 也 能 保证 深度 学 习 模 型 深度 学 习 的 效果 。 


2.1.2 基于 大 数据 的 深度 学 习 模 型 初始 化 系统 


基于 上 述 深 度 学 习 模型 深度 学 习 方 法 ,本 技术 方案 还 提供 一 种 深度 学 习 模 型 深度 学 习 


深度 学 习 模 型 深度 学 习 系 统 的 结构 框图 如 图 2-3 所 特征 信息 获取 模块 1 

示 , 本 实现 中 的 深度 学 习 模型 深度 学 习 系 统 包 括 : 
(1) 特征 信息 获取 模块 1, 用 于 获取 目标 初始 化 深度 特征 信息 匹配 模块 2 

学 习 模 型 的 特征 信息 。 
(2) 特征 信息 匹配 模块 2, 用 于 将 目标 初始 化 深度 学 目标 初始 化 网 络 获取 模块 3 

习 模 型 的 特征 信息 在 预 设 深度 学 习 模 型 数据 库 中 进行 匹 

配 ,得 到 匹配 结果 。 深度 学 习 模型 深度 学 习 模块 4 
特征 信息 匹配 模块 2 可 以 包括 : 图 2-3 深度 学 习 模型 深度 学 习 
@ 数据 库 获取 单元 2-1, 用 于 查询 预 设 的 深度 学 习 模 系统 的 结构 框图 


型 数据 库 ,深度 学 习 模 型 数据 库存 储 有 已 训练 深度 学 习 模型 ; 

@ 匹配 单元 2-2, 用 于 将 目标 初始 化 深度 学 习 模 型 的 特征 信息 与 已 训练 深度 学 习 模型 
的 特征 信息 进行 匹配 ,得 到 匹配 结果 。 

(3) 目标 初始 化 网 络 获取 模块 3, 用 于 根据 匹配 结果 确定 目标 初始 化 深度 学 习 模型 

(4) 深度 学 习 模 型 深度 学 习 模块 4, 用 于 通过 训练 数据 训练 目标 初始 化 深度 学 习 模型 ， 
得 到 深度 学 习 的 目标 深度 学 习 模型 。 

上 述 深 度 学 习 模 型 深度 学 习 系 统 , 由 特征 信息 获取 模块 获取 目标 初始 化 深度 学 习 模型 
的 特征 信息 ,由 特征 信息 匹配 模块 根据 获取 的 目标 初始 化 深度 学 习 模 型 的 特征 信息 在 预先 
构建 的 深度 学 习 模型 数据 库 中 进行 匹配 ,得 到 匹配 结果 ,再 由 目标 初始 化 网 络 获 取 模 块根 据 
该 匹配 结果 确定 所 需 的 目标 初始 化 深度 学 习 模型 ,最 后 由 深度 学 习 模 型 深度 学 习 模 块 通过 
训练 数据 对 该 目标 初始 化 深度 学 习 模型 继续 进行 训练 ,得 到 深度 学 习 的 目标 深度 学 习 模 型 。 
本 技术 方案 的 深度 学 习 模型 深度 学 习 系统 通过 特征 信息 匹配 ,将 预先 存储 的 以 往 训练 过 的 
深度 学 习 模 型 作为 将 来 深度 学 习 模 型 初始 化 的 基础 ,从 而 优化 深度 学 习 模型 初始 化 的 结果 ， 
使 得 深度 学 习 模 型 在 更 优 初始 化 的 情况 下 进行 训练 ,从 而 能 够 缩短 训练 时 间 ,提高 深度 学 习 
模型 的 训练 速度 ,同时 也 能 保证 深度 学 习 模 型 深度 学 习 的 效果 。 
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2.2 深度 学 习 模型 进化 


神经 网 络 是 一 种 进行 分 布 式 并 行 信息 处 理 的 算法 数学 模型 ,常用 于 智能 机 器 识别 。 深 
度 学 习 模型 是 通过 样本 数据 训练 进行 深度 学 习 并 通过 测试 之 后 得 到 的 神经 网 络 , 其 中 ,深度 
学 习 分 有 监督 学 习 和 无 监督 学 习 。 

通常 在 得 到 深度 学 习 模 型 之 后 即 不 会 更 改 ,也 就 是 在 已 训练 深度 学 习 模 型 的 使 用 过 程 
中 不 会 改变 。 然 而 ,深度 学 习 模 型 的 训练 和 测试 的 数据 毕竟 有 限 ,准确 率 不 能 保证 , 且 随 着 
已 训练 深度 学 习 模 型 使 用 过 程 中 输入 的 数据 随时 间 发 生变 化 , 当 使 用 时 间 较 长 时 ,深度 学 习 
模型 的 准确 率 降低 。 例 如 ,识别 某 个 人 的 人 脸 识别 深度 学 习 模 型 , 当 这 个 人 随 着 年 龄 增长 ， 
其 脸 部 特征 也 在 不 断 发 生变 化 ,所 以 该 人 脸 识别 深度 学 习 模 型 的 适用 性 在 不 断 变 差 ,准确 率 
Bee AEE) 。 

本 技术 研究 并 给 出 了 一 种 新 的 深度 学 习 模型 进化 方法 ,装置 .介质 和 计算 机 设备 。 该 方 
法 包括 : 将 输入 数据 输入 调 取 的 已 训练 的 深度 学 习 模型 得 到 输出 数据 ,记录 使 用 时 间 及 获 
取 对 应 的 真实 结果 数据 ; 按照 预 设 的 抽查 规则 选取 使 用 过 程 中 的 输入 数据 、 输 出 数据 、 使 用 
时 间 和 真实 结果 数据 ; 将 选取 的 输入 数据 及 对 应 的 输出 数据 、 真 实 结 果 数 据 和 使 用 时 间 组 
成 数据 组 ; 计算 数据 组 中 输出 数据 与 真实 结果 数据 的 差异 值 ,统计 预 设 时 间 段 内 所 有 数据 
组 中 差异 值 大 于 预 设 阔 值 的 差异 组 的 组 数 , 若 组 数 大 于 或 等 于 存储 的 组 数 阔 值 ,根据 差异 组 
的 输入 数据 和 真实 结果 数据 对 已 训练 的 深度 学 习 模型 进行 训练 得 到 进化 后 的 深度 学 习 模 
型 。 如 此 可 纠正 深度 学 习 模 型 的 偏差 ,提高 准确 率 。 


2.2.1 深度 学 习 模型 进化 方法 


1. 深度 学 习 模型 进化 的 基本 方法 

参考 图 2-4 ,在 一 个 技术 方案 中 ,提供 了 一 种 深度 学 习 模 型 进化 方法 ,包括 如 下 步 又 : 

(1) 步骤 S1, 指 调 取 已 训练 的 深度 学 习 模 型 ,将 输入 数据 输入 已 训练 的 深度 学 习 模型 
进行 深度 学 习 , 得 到 输出 数据 并 记录 使 用 时 间 及 获取 对 应 输入 数据 的 真实 结果 数据 。 

输入 数据 是 用 于 输入 深度 学 习 模 型 的 数据 ,在 步骤 S110 之 前 包括 获取 输入 数据 步骤 。 
输入 数据 可 以 通过 采集 或 用 户 输入 得 到 ,输入 数据 的 类 型 由 对 应 的 深度 学 习 模型 的 类 型 确 
定 。 例 如 , 若 深度 学 习 模 型 为 用 于 人 脸 识别 的 神经 网 络 , 则 输入 数据 为 人 脸 图 像 数 据 ; 若 深 
度 学 习 模 型 为 用 于 语音 识别 的 神经 网 络 , 则 输入 数据 为 语音 数据 。 

其 中 ,使 用 时 间 是 将 输入 数据 输入 已 训练 的 深度 学 习 模 型 的 时 间 ,也 可 以 是 得 到 输出 数 
据 的 时 间 。 使 用 时 间 可 以 以 日 期 为 单位 ,也 可 以 精确 到 日 期 内 的 具体 时 刻 。 对 应 的 真实 结 
果 数 据 是 对 应 输入 数据 的 客观 现实 结果 ,可 以 通过 用 户 反馈 得 到 ; 对 应 的 真实 结果 数据 也 
可 以 根据 人 工 检测 输入 数据 得 到 。 例 如 ,输入 数据 为 人 脸 图 像 数 据 , 则 可 以 直接 由 用 户 反馈 
“0” 或 “1” 作 为 对 应 的 真实 结果 数据 ,也 可 以 通过 人 工 检 测 得 到 “0” 或 “1”,“0” 和 “1” 分 别 表示 
输入 的 人 脸 图 像 数据 对 应 为 非 目 标 人 物 的 人 脸 、 目 标 人 物 的 人 脸 。 
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SRS): 调 取 已 训练 的 深度 学 习 模型 ， 将 输入 数据 输入 已 训练 的 
深度 学 习 模型 进行 深度 得 到 输出 数据 并 记录 使 用 时 间 及 获 
取 对 应 输入 数据 的 真实 结果 数据 
1 


步骤 $2 : 按照 预 设 的 抽查 规则 选取 已 训练 的 深度 学 习 模型 使 用 
过 程 中 的 输入 数据 、 输 出 数据 、 使 用 时 间 和 真实 结果 数据 


Ll 
步骤 $S3 : 将 选取 的 输入 数据 及 对 应 的 输出 数据 、 真 实 结果 
数据 和 使 用 时 间 组 成 一 个 数据 组 


1 
步骤 $S4 : 计算 每 个 数据 组 中 输出 数据 与 同 组 内 对 应 的 真实 结果 数据 的 差 
异 值 ， 以 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 对 应 差异 值 大 
于 预 设 国 值 的 数据 组 为 差异 组 ， 统 计 差 异 组 的 组 数 


了 
步 又 S5 : 若 组 数 大 于 或 等 于 存储 的 组 数 国 值 ， 则 将 每 一 个 差异 组 中 
的 输入 数据 和 真实 结果 数据 分 别 作为 输入 和 预期 输出 对 已 训练 的 深度 
学 习 模型 进行 训练 ， 得 到 进化 后 的 深度 学 习 模 型 


图 2-4 深度 学 习 模型 进化 方法 的 流程 


已 训练 的 深度 学 习 模型 是 需要 进行 进化 的 深度 学 习 模 型 。 其 中 ,输出 数据 与 对 应 的 真 
实 结 果 数 据 的 格式 相同 ,便于 比较 。 例 如 ,输出 数据 和 真实 结果 数据 均 用 *0” 和 “1” 分 别 表示 
输入 的 人 脸 图 像 数 据 对 应 为 非 目 标 人 物 的 人 脸 .目标 人 物 的 人 脸 。 

(2) 步 又 S2 ,按照 预 设 的 抽查 规则 选取 已 训练 的 深度 学 习 模 型 使 用 过 程 中 的 输入 数 
据 、 输 出 数据 、 使 用 时 间 和 真实 结果 数据 。 

步骤 Sl 中 将 输入 数据 输入 已 训练 的 深度 学 习 模型 是 对 已 训练 的 深度 学 习 模 型 的 使 用 ， 
多 次 进行 步骤 S1 则 可 以 得 到 每 一 次 使 用 对 应 的 输入 数据 、 输 出 数据 、 使 用 时 间 和 真实 结果 
数据 。 如 果 每 次 使 用 已 训练 的 深度 学 习 模 型 所 对 应 的 数据 都 获取 ,会 导致 数据 处 理 成 本 过 
高 ,所 以 需要 采用 抽查 的 方式 来 降低 数据 处 理 成 本 。 例 如 , 预 设 的 抽查 规则 可 以 是 每 K 次 
使 用 中 获取 1 次 使 用 的 输入 数据 、 输 出 数据 、 使 用 时 间 和 对 应 的 真实 结果 数据 ,其 中 ,K 二 1， 
例如 100。 

(3) 步骤 S3, 将 选取 的 输入 数据 及 对 应 的 输出 数据 、 对 应 的 真实 结果 数据 和 对 应 的 使 
用 时 间 组 成 一 个 数据 组 。 

例如 ,S3 可 以 包括 : 将 S2 中 每 次 获取 到 的 输入 数据 、 输 出 数据 、 真 实 结果 数 据 和 使 用 
时 间 组 成 一 个 数据 组 并 保存 。 可 以 将 数据 组 保存 在 数据 库 中 ,如 存 人 进化 知识 库 的 一 个 数 
据 组 : 1 月 1 日 ,输入 数据 为 人 脸 图 像 A, 输 出 数据 为 1( 代 表 张 三 人 脸 ) ,对 应 的 真实 结果 数 
据 为 1( 代 表 张 三 人 脸 ) 。 

(4) 步 又 S4 ,计算 每 个 数据 组 中 输出 数据 与 同 组 内 对 应 的 真实 结果 数据 的 差异 值 , 以 
使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 对 应 差异 值 大 于 预 设 阔 值 的 数据 组 为 差异 组 ， 
统计 差异 组 的 组 数 。 

获取 的 同 组 内 的 输出 数据 与 对 应 的 真实 结果 数据 的 差异 值 可 以 反映 已 训练 的 深度 学 习 
模型 此 次 深度 学 习 的 准确 性 。 比 较 输 出 数据 与 对 应 的 真实 结果 数据 是 否 一 致 , 越 一 致 , 则 差 
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异 值 越 小 ; 越 不 一 致 , 则 差异 值 越 大 。 预 设 时 间 段 和 预 设 阔 值 根据 实际 需要 预先 设置 。 预 
设 阔 值 可 以 为 0, 也 可 以 为 能 够 接受 的 输出 误差 值 。 差 异 值 大 于 预 设 阔 值 ,表示 对 应 数据 组 
中 的 输出 数据 和 对 应 的 真实 结果 数据 的 差异 不 可 接受 , 即 输出 结果 错误 ,从 而 统计 的 差异 组 
的 组 数 即 为 预 设 时 间 段 内 输出 结果 错误 的 次 数 。 

(5) 步骤 SS , 若 组 数 大 于 或 等 于 存储 的 组 数 阔 值 , 则 将 每 一 个 差异 组 中 的 输入 数据 和 
真实 结果 数据 分 别 作为 输入 和 预期 输出 对 已 训练 的 深度 学 习 模型 进行 训练 ,得 到 进化 后 的 
深度 学 习 模 型 。 

组 数 阔 值 用 于 作为 参考 , 若 组 数 大 于 或 等 于 组 数 阔 值 , 则 表示 预 设 时 间 段 内 深度 学 习 结 
果 错 误 的 次 数 不 在 可 接受 范围 内 ,已 训练 的 深度 学 习 模型 的 准确 率 较 低 , 此 时 通过 将 每 一 个 
差异 组 的 输入 数据 和 真实 结果 数据 分 别 作为 输入 和 预期 输出 对 已 训练 的 深度 学 习 模型 进行 
训练 ,可 进化 深度 学 习 模型 。 

上 述 深度 学 习 模 型 进化 方法 ,通过 将 输入 数据 输入 已 训练 的 深度 学 习 模 型 进行 深度 学 
习 得 到 输出 数据 ,选取 输入 数据 及 与 输入 数据 对 应 的 输出 数据 ,使 用 时 间 和 真实 结果 数据 并 
将 相对 应 的 数据 作为 一 个 数据 组 ,统计 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 输出 数 
据 与 对 应 的 真实 结果 数据 的 差异 值 大 于 预 设 阔 值 的 差异 组 的 组 数 ; 在 组 数 大 于 或 等 于 组 数 
阔 值 时 ,采用 差异 组 的 输入 数据 和 对 应 的 真实 结果 数据 对 已 训练 的 深度 学 习 网 络 进行 训练 ， 
从 而 在 已 训练 的 深度 学 习 模 型 的 使 用 过 程 中 进行 进化 ,可 纠正 深度 学 习 模型 的 偏差 ,提高 深 
度 学 习 模 型 的 准确 率 。 

2. 深度 学 习 模型 进化 的 详细 方法 

在 一 个 技术 方案 中 ,步骤 S4 之 后 包括 : 若 组 数 小 于 存储 的 组 数 阔 值 , 则 返回 步骤 S1。 

差异 组 的 组 数 小 于 组 数 阔 值 ,表示 预 设 时 间 段 内 存在 差异 的 数据 组 的 数量 在 可 接受 范 
围 内 ,此 时 返回 步骤 S1, 可 继续 使 用 已 训练 的 深度 学 习 模型 。 

具体 而 言 ,每 按照 预 设 的 抽查 规则 完成 一 次 选取 可 保存 一 个 数据 组 。 在 一 个 技术 方案 
中 ,步骤 S4 可 以 包括 : 计算 最 新 保存 的 数据 组 中 输出 数据 与 对 应 的 真实 结果 数据 的 差异 
值 , 若 差异 值 大 于 预 设 阔 值 , 则 更 新 已 存 的 差异 组 的 组 数 。 其 中 ,已 存 的 差异 组 的 组 数 初始 
值 为 0, 更 新 已 存 的 差异 组 的 组 数 可 以 是 在 已 存 的 差异 组 的 组 数 上 加 1 得 到 新 的 差异 组 的 
组 数 。 

通过 在 按照 预 设 的 抽查 规则 完成 每 一 次 选取 后 统计 差异 组 的 组 数 ,后 续 深 度 学 习 完 成 
后 只 需要 在 已 存 的 差异 组 的 组 数 上 简单 地 更 新 即 可 ,处 理 简 便 。 

也 可 以 采用 其 他 方式 统计 差异 组 的 组 数 ,例如 ,步骤 S4 还 可 以 包括 : 获取 所 有 数据 组 
中 输出 数据 与 同 组 内 对 应 的 真实 结果 数据 的 差异 值 :以 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 
数据 组 中 对 应 差异 值 大 于 预 设 阔 值 的 数据 组 为 差异 组 ,统计 差异 组 的 组 数 。 即 : 每 按照 预 
设 的 抽查 规则 完成 一 次 选取 , 则 统计 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 差异 组 的 
组 数 。 

在 一 个 技术 方案 中 ,组 数 阔 值 可 以 为 固定 值 。 将 差异 组 的 组 数 与 固定 值 比 较 以 纠正 深 
度 学 习 模 型 的 偏差 ,固定 值 越 小 ,可 接受 的 错误 次 数 越 少 ,对 应 进化 的 深度 学 习 模 型 准确 性 
越 高 。 通 过 预 设 一 个 固定 值 并 存储 作为 组 数 阔 值 ,固定 值 可 以 根据 实际 需要 具体 设置 ,因此 
可 提高 进化 效果 设计 的 灵活 性 。 

在 另 一 个 技术 方案 中 ,步骤 S3 之 后 步骤 S5 之 前 ,包括 组 数 阔 值 存储 步骤 , 即 根据 数据 


组 获取 当前 的 组 数 阔 值 并 存储 。 

根据 得 到 的 数据 组 获取 组 数 阔 值 , 组 数 阔 值 随 存储 的 数据 组 动态 调整 ,适应 性 高 。 具 体 
而 言 ,组 数 阔 值 存储 步骤 可 以 是 在 步骤 S4 之 前 执行 ,也 可 以 是 在 步骤 S4 之 后 执行 ,还 可 以 
与 步骤 S4 同时 执行 。 

组 数 阔 值 存储 步骤 可 以 包括 : 统计 使 用 时 间 属 于 预 设 时 间 段 内 的 数据 组 的 总 组 数 ; 根 
据 总 组 数 计算 得 到 当前 的 组 数 阔 值 并 存储 。 其 中 ,当前 的 组 数 阔 值 小 于 总 组 数 。 

根据 总 组 数 计算 得 到 当前 的 组 数 阔 值 ,得 到 的 组 数 阔 值 随 总 组 数 变动 , 即 随 预 设 时 间 段 
内 深度 学 习 的 总 次 数 变 动 ,从 而 可 根据 总 组 数 对 应 的 组 数 阔 值 判断 是 否 需 要 对 已 训练 的 深 
度 学 习 模 型 进行 训练 。 

根据 总 组 数 计算 得 到 当前 的 组 数 阔 值 并 存储 可 以 是 计算 总 组 数 与 第 一 预 设 比例 的 乘积 
得 到 当前 的 组 数 阔 值 并 存储 ,其 中 ,第 一 预 设 比例 大 于 零 且 小 于 1。 本 技术 方案 中 ,第 一 预 
设 比例 为 1/4。 

组 数 阔 值 存储 步骤 还 可 以 包括 : 统计 使 用 时 间 属 于 预 设 参考 时 间 段 内 的 所 有 数据 组 中 
对 应 差异 值 大 于 预 设 阔 值 的 数据 组 的 数量 ; 根据 数据 组 数量 计算 得 到 当前 的 组 数 阔 值 并 
存储 。 

预 设 参考 时 间 段 可 以 根据 实际 需要 设置 。 根 据 统计 的 数量 计算 得 到 当前 的 组 数 阔 值 ， 
组 数 阔 值 随 统计 得 到 的 数量 变动 : 如 果 将 统计 得 到 的 数量 直接 作为 当前 的 组 数 阔 值 , 则 相 
当 于 将 预 设 参考 时 间 段 内 与 预 设 时 间 段 内 的 抽查 得 到 的 输出 结果 的 错误 次 数 进行 比较 。 当 
预 设 时 间 段 内 抽查 到 的 输出 结果 的 错误 次 数 大 于 或 等 于 预 设 参考 时 间 段 内 抽查 到 的 输出 结 
果 的 错误 次 数 时 ,采用 差异 组 的 输入 数据 和 真实 结果 数据 对 已 训练 的 深度 学 习 模 型 进行 
训练 。 

可 以 计算 统计 得 到 的 数量 与 第 二 预 设 比例 的 乘积 得 到 当前 的 组 数 阔 值 并 存储 。 当 第 二 
预 设 比例 大 于 1 时 ,例如 为 1.5, 表 明 要 求 深度 学 习 模 型 的 准确 率 在 使 用 过 程 中 需要 变 高 到 
相应 比例 。 当 第 二 预 设 比例 小 于 1 时 ,例如 为 0.5, 表 明 对 深度 学 习 模 型 的 准确 率 要 求 在 使 
用 的 过 程 中 可 以 变 低 到 相应 比例 。 

在 一 个 技术 方案 中 , 预 设 时 间 段 为 以 当前 时 刻 为 结束 点 的 对 已 训练 的 深度 学 习 模 型 进 
行 预 设 次 数 的 使 用 的 时 间 段 ; 或 者 为 以 当前 时 刻 为 结束 点 .时 长 为 第 一 预 设 时 长 的 时 间 段 ， 
即时 长 固定 。 例 如 , 预 设 时间 段 可 以 是 从 开始 到 当前 时 刻 的 整个 时 间 段 ,可 以 是 整个 时 间 段 
中 最 近 1 年 的 时 间 段 .也 可 以 是 整个 时 间 段 中 最 近 100 次 使 用 已 训练 的 深度 学 习 模 型 的 时 
间 段 。 其 中 , 预 设 次 数 和 第 一 预 设 时 长 可 以 根据 实际 情况 具体 设置 。 

本 技术 方案 中 , 预 设 参考 时 间 段 为 以 预 设 起 始 时 刻 为 起 始点 、 预 设 结束 时 刻 为 结束 点 的 
时 间 段 , 即 预 设 参考 时 间 段 是 预先 设置 的 一 个 固定 时 间 段 ; 或 者 可 以 是 一 个 以 已 训练 的 深 
度 学 习 模型 第 一 次 使 用 的 时 刻 为 起 始点 .时 长 为 第 一 预 设 时 长 的 时 间 段 ; 或 者 可 以 是 一 个 
以 已 训练 的 深度 学 习 模 型 第 一 次 使 用 的 时 刻 为 起 始点 、 使 用 次 数 为 预 设 次 数 的 时 间 段 ; 或 
者 可 以 是 一 个 以 当前 时 刻 的 第 二 预 设 时 长 之 前 的 时 刻 为 结束 点 、 时 长 为 第 一 预 设 时 长 的 时 
间 段 ; 或 者 可 以 是 一 个 以 当前 时 刻 的 第 二 预 设 时 长 之 前 的 时 刻 为 结束 点 、 使 用 次 数 为 预 设 
次 数 的 时 间 段 。 其 中 ,第 二 预 设 时 长 大 于 第 一 预 设 时 长 。 

在 一 个 技术 方案 中 ,步骤 S5 中 将 每 一 个 差异 组 中 的 输入 数据 和 真实 结果 数据 分 别 作 为 
输入 和 预期 输出 对 已 训练 的 深度 学 习 模 型 进行 训练 ,得 到 进化 后 的 深度 学 习 模 型 的 步骤 
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包括 : 

步骤 5-1, 将 所 有 差异 组 中 的 输入 数据 输入 已 训练 的 深度 学 习 模 型 进行 无 监督 学 习 ， 
得 到 初步 进化 的 深度 学 习 模 型 。 

@ 步骤 5-2, 将 所 有 差异 组 中 的 输入 数据 和 对 应 的 真实 结果 数据 分 别 作为 输入 和 预期 
输出 ,对 初步 进化 的 深度 学 习 模 型 进行 有 监督 学 习 , 得 到 进化 后 的 深度 学 习 模 型 。 

无 监督 学 习 和 有 监督 学 习 是 深度 学 习 的 学 习 方 式 。 在 将 所 有 差异 组 中 的 输入 数据 输入 
已 训练 的 深度 学 习 模型 进行 无 监督 学 习 得 到 初步 进化 的 深度 学 习 模型 的 基础 上 ,再 根据 差 
异 组 中 的 输入 数据 和 对 应 的 真实 结果 数据 对 初步 进化 的 深度 学 习 模型 进行 有 监督 学 习 , 结 
合 无 监督 学 习 和 有 监督 学 习 , 得 到 的 进化 后 的 深度 学 习 模 型 更 接近 全 局 最 优 , 偏 差 纠 正 效果 
好 ,从 而 准确 率 更 高 。 

在 一 个 技术 方案 中 ,参考 图 2-5, 步 又 S5-1 包括 步骤 S5-1-1 和 步骤 S5-1-2。 


步 又 S5-1-1 : 按照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ， 选 取 第 一 差异 组 
中 的 输入 数据 输入 已 训练 的 模型 进行 无 监督 学 习 ， 
得 到 对 应 的 训练 深度 学 习 模型 


步骤 $S5-1-2 : 选取 下 一 差异 
深度 学 习 模型 的 输入 ， 对 前 一 深 
督学 习 得 到 对 应 的 训练 深度 学 模型 ， PLEAS Bi 

应 的 训练 深度 学 习 模型 并 作为 初步 进化 的 深度 学 


| 


步骤 S5-2-1 : 按照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ， 选 取 第 一 差异 组 
中 的 输入 数据 和 对 应 的 真实 结果 数据 分 别 作为 初步 进化 的 深度 学 习 模型 
的 输入 和 预期 输出 ， 对 初步 进化 的 深度 学 习 模型 进行 有 监督 学 习 ， 
得 到 对 应 的 改进 深度 学 习 模型 


| 


步骤 S5-2-2 : 选取 下 一 差异 组 中 的 输入 数据 和 真实 结果 数据 分 别 作为 前 
-差异 组 对 应 的 改进 深度 学 习 模型 的 输入 和 预期 输出 ， 对 前 一 差异 组 
对 应 的 改进 深度 学 习 模 型 进行 有 监督 学 习 ， 得 到 改进 深度 学 习 模 型 ， 循 
环 直到 得 到 最 后 一 组 差异 组 对 应 的 改进 深度 学 习 模型 并 作为 进化 后 的 深 
度 学 习 模型 


图 2-5 得 到 进化 后 的 深度 学 习 模 型 的 具体 流程 


步骤 S5-1-1, 按 照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ,选取 第 一 差异 组 中 的 输入 数据 输 
入 已 训练 的 深度 学 习 模型 进行 无 监督 学 习 , 得 到 对 应 的 训练 深度 学 习 模 型 。 

差异 组 的 组 数 有 多 个 时 ,按照 差异 组 使 用 时 间 的 先后 顺序 进行 排序 ,使 用 时 间 越 靠 前 的 
排序 越 靠 前 ,第 一 差异 组 为 最 先进 行 抽查 得 到 的 差异 组 。 

步骤 S5-1-2 ,选取 下 一 差异 组 中 的 输入 数据 作为 前 一 差异 组 对 应 的 训练 深度 学 习 模 型 
的 输入 ,对 前 一 差异 组 对 应 的 训练 深度 学 习 模 型 进行 无 监督 学 习 得 到 对 应 的 训练 深度 学 习 模 
型 ,循环 直到 得 到 最 后 一 组 差异 组 对 应 的 训练 深度 学 习 模 型 并 作为 初步 进化 的 深度 学 习 模 型 。 

按照 使 用 时 间 的 先后 顺序 进行 无 监督 学 习 , 后 一 次 无 监督 学 习 在 前 一 次 无 监督 学 习 得 
到 的 训练 深度 学 习 模型 上 进行 ,从 而 使 用 时 间 越 靠 后 越 接近 将 来 使 用 的 时 间 , 即 越 是 后 输入 
的 数据 越 接近 将 来 的 使 用 时 间 ,而 越 后 输入 的 数据 是 过 去 最 近 的 时 间 产 生 的 数据 ,从 而 使 得 
无 监督 学 习 后 的 深度 学 习 模 型 更 能 适应 将 来 使 用 的 需要 。 


中 的 输入 数据 作为 一 差异 组 对 应 的 训练 

训练 模型 进行 无 监 
-组 差异 组 对 
模型 
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在 一 个 技术 方案 中 ,继续 参考 图 2-5, 步 骤 S5-2 包括 步骤 S5-2-1 和 步骤 S5-2-2。 

步骤 S5-2-1 ,按照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ,选取 第 一 差异 组 中 的 输入 数据 和 
对 应 的 真实 结果 数据 分 别 作为 初步 进化 的 深度 学 习 模 型 的 输入 和 预期 输出 ,对 初步 进化 的 
深度 学 习 模 型 进行 有 监督 学 习 , 得 到 对 应 的 改进 深度 学 习 模 型 。 

步骤 S5-2-2, 选 取 下 一 差异 组 中 的 输入 数据 和 真实 结果 数据 分 别 作 为 前 一 差异 组 对 应 
的 改进 深度 学 习 模型 的 输入 和 预期 输出 ,对 前 一 差异 组 对 应 的 改进 深度 学 习 模 型 进行 有 监 
督学 习 , 得 到 改进 深度 学 习 模型 .循环 直到 得 到 最 后 一 组 差异 组 对 应 的 改进 深度 学 习 模 型 并 
作为 进化 后 的 深度 学 习 模 型 。 

在 无 监督 学 习 后 的 初步 进化 的 深度 学 习 模 型 基础 上 ,按照 使 用 时 间 的 先后 顺序 进行 有 
监督 学 习 , 后 一 次 有 监督 学 习 在 前 一 次 有 监督 学 习 得 到 的 改进 深度 学 习 模 型 上 进行 ,从 而 使 
用 时 间 越 靠 后 越 接近 将 来 使 用 的 时 间 , 即 越 是 后 输入 的 数据 越 接近 将 来 的 使 用 时 间 ,而 越 后 
输入 的 数据 是 过 去 最 近 的 时 间 产 生 的 数据 ,从 而 使 得 最 终 进 化 后 的 深度 学 习 模 型 更 能 适应 
将 来 使 用 的 需要 ,准确 率 更 高 。 

参考 图 2-6 和 图 2-7 ,把 学 习 结构 看 作 一 个 网 络 ,深度 学 习 的 核心 思路 如 下 


类 别 标签 


特征 


输出 层 


特征 


隐 层 


输入 层 输入 特征 


图 2-6 含 多 个 隐藏 层 的 深度 学 习 模 型 图 2-7 深度 学 习 模型 的 核心 思路 示意 


首先 ,采用 自 下 而 上 的 无 监督 学 习 , 逐 层 构建 单 层 神经 元 。 每 层 采 用 Wake-Sleep 算法 
进行 调 优 ,每 次 仅 调 整 一 层 , 逐 层 调整 。 这 个 过 程 可 以 看 作 是 一 个 Feature Learning 的 过 
程 ,是 和 传统 神经 网 络 区 别 最 大 的 部 分 。 其 中 , Wake-Sleep 算法 包括 Wake 阶段 和 Sleep 阶 
Be. Wake 阶段 : 认 知 过 程 ,通过 下 层 的 输入 特征 (Input) 和 向 上 的 认 知 (Encoder) 权 重 产生 
每 一 层 的 抽象 表示 (Code),. 再 通过 当前 的 生成 (Decoder) 权 重 产 生 一 个 重建 信息 
(Reconstruction) ,计算 输入 特征 和 重建 信息 残 差 ,使 用 梯度 下 降 修改 层 间 的 下 行 生 成 权重 。 
即 Sleep 阶段 : 生成 过 程 ,通过 上 层 概 念 和 向 下 的 生成 权重 ,生成 下 层 的 状态 ,再 利用 认 知 权 
重 产生 一 个 抽象 景象 。 利 用 初始 上 层 概念 和 新 建 抽象 景象 的 残 差 ,利用 梯度 下 降 修改 层 间 
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向 上 的 认 知 权重 。 具 体 而 言 , 先 用 无 标定 数据 训练 第 一 层 , 训 练 时 先 学 习 第 一 层 的 参数 (这 
一 层 可 以 看 作 是 得 到 一 个 使 得 输出 数据 和 输入 数据 差别 最 小 的 三 层 神经 网 络 的 隐藏 层 ) ,由 
于 模型 Capacity 的 限制 以 及 稀 玻 性 约束 ,使 得 得 到 的 模型 能 够 学 习 到 数据 本 身 的 结构 ,从 
而 得 到 比 输入 数据 更 具有 表示 能 力 的 特征 ; 在 学 习 得 到 第 ”一 1 层 后 ,将 第 一 1 层 的 输出 
数据 作为 第 n 层 的 输入 数据 ,训练 第 nn 层 ,由 此 分 别 得 到 各 层 的 参数 。 

然后 ,进行 自 顶 向 下 的 有 监督 学 习 。 这 一 步 是 在 第 一 步 学 习 获 得 各 层 参 数 进 的 基础 
上 ,在 最 顶部 的 编码 层 添加 一 个 分 类 器 (例如 Logistic 回归 、SVM 等 ) ,而 后 通过 带 标签 数 
据 的 有 监督 学 习 , 利 用 梯度 下 降 法 微调 整个 网 络 参数 。 深 度 学 习 的 第 一 步 实 质 上 是 一 个 
网 络 参 数 初 始 化 过 程 。 区 别 于 传统 神经 网 络 初 值 随机 初始 化 ,深度 学 习 模 型 是 通过 在 无 
监督 学 习 输 入 数据 的 结构 上 得 到 的 ,因而 这 个 初 值 更 接近 全 局 最 优 ,从 而 能 够 取得 更 好 
的 效果 。 

在 一 个 技术 方案 中 ,步骤 SS 之 后 包括 : 删除 所 有 数据 组 ,将 进 深度 学 习 模 型 作 
为 新 的 已 训练 的 深度 学 习 模 型 ,并 返回 步骤 S1 。 

通过 在 步骤 S5 后 删除 所 有 数据 组 ,从 而 进行 清 零 , 避 免 存 储 的 数据 组 对 深度 学 习 模型 
的 下 一 轮 进化 产生 影响 。 


2.2.2 深度 学 习 模型 进化 系统 


1. 深度 学 习 模型 进化 系统 的 基本 模块 
参考 图 2-8, 在 一 个 技术 方案 中 ,提供 一 种 深度 学 习 模 型 进化 装置 ,包括 数据 获取 模块 
1 ,数据 选取 模块 2 数据 保存 模块 3、 组 数 统计 模块 4 和 网 络 进化 模块 5。 


数据 获取 模 数据 选取 模 
块 1 块 2 


数据 保存 模 
块 3 


组 数 统计 模 
块 4 


网 络 进化 模 
块 5 


图 2-8 深度 学 习 模型 进化 装置 的 结构 


(1) 数据 获取 模块 1, 用 于 调 取 已 训练 的 深度 学 习 模 型 ,将 输入 数据 输入 已 训练 的 深度 
学 习 模 型 进行 深度 学 习 , 得 到 输出 数据 并 记录 使 用 时 间 及 获取 对 应 输入 数据 的 真实 结果 
数据 。 

(2) 数据 选取 模块 2, 用 于 按照 预 设 的 抽查 规则 选取 已 训练 的 深度 学 习 模 型 使 用 过 程 中 
的 输入 数据 .输出 数据 ,使 用 时 间 和 真实 结果 数据 。 

(3) 数据 保存 模块 3, 用 于 将 选取 的 输入 数据 及 对 应 的 输出 数据 真实 结果 数据 和 使 用 
时 间 组 成 一 个 数据 组 。 

(4) 组 数 统计 模块 4, 用 于 计算 每 个 数据 组 中 输出 数据 与 同 组 内 对 应 的 真实 结果 数据 的 
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差异 值 , 以 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 对 应 差异 值 大 于 预 设 阔 值 的 数据 组 
为 差异 组 ,统计 差异 组 的 组 数 。 

(5) 网 络 进化 模块 5, 用 于 在 组 数 大 于 或 等 于 存储 的 组 数 阔 值 时 ,将 每 一 个 差异 组 中 的 
输入 数据 和 真实 结果 数据 分 别 作为 输入 和 预期 输出 对 已 训练 的 深度 学 习 模 型 进行 训练 ,得 
到 进化 后 的 深度 学 习 模 型 。 

上 述 深度 学 习 模 型 进化 装置 ,通过 将 输入 数据 输入 已 训练 的 深度 学 习 模 型 进行 深度 学 
习 得 到 输出 数据 ,选取 输入 数据 及 与 输入 数据 对 应 的 输出 数据 、 使 用 时 间 和 真实 结果 数据 并 
将 相对 应 的 数据 作为 一 个 数据 组 ,统计 使 用 时 间 属 于 预 设 时 间 段 内 的 所 有 数据 组 中 输出 数 
据 与 对 应 的 真实 结果 数据 的 差异 值 大 于 预 设 阔 值 的 差异 组 的 组 数 ; 在 组 数 大 于 或 等 于 组 数 
阅 值 时 ,采用 差异 组 的 输入 数据 和 对 应 的 真实 结果 数据 对 已 训练 的 深度 学 习 网 络 进 行 训 练 ， 
从 而 在 已 训练 的 深度 学 习 模型 使 用 过 程 中 进行 进化 ,可 纠正 深度 学 习 模 型 的 偏差 ,提高 深度 
学 习 模型 的 准确 率 。 

2. 深度 学 习 模型 进化 系统 的 扩展 模块 

上 述 深度 学 习 模 型 进化 装置 包括 循环 模块 (图 2-8 中 未 说 明 ) ,用 于 在 差异 组 的 组 数 小 
于 存储 的 组 数 阔 值 时 ,返回 数据 获取 模块 1 再 次 调 取 已 训练 的 深度 学 习 模型 ,将 输入 数据 输 
入 已 训练 的 深度 学 习 模 型 进行 深度 学 习 , 得 到 输出 数据 并 记录 使 用 时 间 及 获取 对 应 输入 数 
据 的 真实 结果 数据 。 如 此 ,可 进行 下 一 次 使 用 。 

具体 而 言 ,每 按照 预 设 的 抽查 规则 完成 一 次 选取 可 保存 一 个 数据 组 。 在 一 个 技术 方案 
中 ,组 数 统计 模块 4 可 以 用 于 计算 最 近 保存 的 数据 组 中 输出 数据 与 对 应 的 真实 结果 数据 的 
差异 值 , 若 差异 值 大 于 预 设 阔 值 , 则 更 新 已 存 的 差异 组 的 组 数 。 其 中 ,已 存 的 差异 组 的 组 数 
初始 值 为 0, 更 新 已 存 的 差异 组 的 组 数 可 以 是 在 已 存 的 差异 组 的 组 数 上 加 1 得 到 新 的 差异 
组 的 组 数 。 

每 按照 预 设 的 抽查 规则 完成 一 次 选取 后 统计 差异 组 的 组 数 ,后 续 深 度 学 习 完成 后 只 需 
要 在 已 存 的 差异 组 的 组 数 上 简单 地 更 新 即 可 ,处 理 简便 。 

也 可 以 采用 其 他 方式 统计 差异 组 的 组 数 ,例如 ,组 数 统计 模块 4 还 可 用 于 : 获取 所 有 数 
据 组 中 输出 数据 与 同 组 内 对 应 的 真实 结果 数据 的 差异 值 , 以 使 用 时 间 属 于 预 设 时 间 段 内 的 
所 有 数据 组 中 对 应 差异 值 大 于 预 设 阔 值 的 数据 组 为 差异 组 ,统计 差异 组 的 组 数 。 即 : 每 按 
照 预 设 的 抽查 规则 完成 一 次 巡 区 , 则 统计 所 有 数据 组 中 差异 组 的 组 数 。 

在 一 个 技术 方案 中 ,组 数 阔 值 可 以 为 固定 值 。 通 过 预 设 一 个 固定 值 并 存储 作为 组 数 阔 
值 , 固 定 值 可 以 根据 实际 需要 具体 设置 ,因此 可 提高 进化 效果 设计 的 灵活 性 。 

在 另 一 个 技术 方案 中 ,上 述 深度 学 习 模 型 进化 装置 包括 组 数 阔 值 存 储 模 块 (图 2-8 中 未 
说 明 ) ,用 于 在 数据 保存 模块 3 执行 相应 功能 之 后 、 网 络 进化 模块 5 执行 相应 功能 之 前 ,根据 
数据 组 获取 当前 的 组 数 阔 值 并 存储 。 根 据 已 经 得 到 的 数据 组 获取 组 数 阔 值 ,组 数 阔 值 随 存 
储 的 数据 组 动态 调整 ,适应 性 高 。 

组 数 阔 值 存 储 模 块 可 以 用 于 : 统计 使 用 时 间 属 于 预 设 时 间 段 内 的 数据 组 的 总 组 数 ; 根 
据 总 组 数 计 算得 到 当前 的 组 数 阔 值 并 存储 。 其 中 ,当前 的 组 数 阔 值 小 于 总 组 数 。 

根据 总 组 数 计算 得 到 当前 的 组 数 阔 值 ,组 数 阔 值 随 总 组 数 变动 , 即 随 预 设 时 间 段 内 深度 
学 习 的 总 次 数 变动 .从 而 可 根据 总 组 数 对 应 的 组 数 阔 值 判断 是 否 需要 对 已 训练 的 深度 学 习 
模型 进行 训练 。 
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可 以 计算 总 组 数 与 第 一 预 设 比例 的 乘积 得 到 当前 的 组 数 阔 值 并 存储 ,其 中 ,第 一 预 设 比 
例 大 于 零 且 小 于 1。 本 技术 方案 中 ,第 一 预 设 比例 为 1/4。 

组 数 阔 值 存储 模块 还 可 以 用 于 : 统计 使 用 时 间 属 于 预 设 参考 时 间 段 内 的 所 有 数据 组 中 
对 应 差异 值 大 于 预 设 阔 值 的 数据 组 的 数量 ; 根据 数据 组 数量 计算 得 到 当前 的 组 数 阔 值 并 
存储 。 

预 设 参考 时 间 段 可 以 根据 实际 需要 设置 ,可 以 是 预先 设置 的 一 个 确定 起 始 时 刻 、 结 
束 时 刻 的 国定 时 间 段 ,也 可 以 是 一 个 以 当前 时 刻 为 结束 点 确定 的 时 间 段 。 通 过 根据 统计 
的 数量 计算 得 到 当前 的 组 数 阔 值 ,组 数 阔 值 随 数量 变动 ,从 而 将 两 个 时 间 段 内 的 深度 学 
习 的 错误 次 数 进行 比较 , 当 预 设 时 间 段 内 深度 学 习 的 错误 次 数 大 于 或 等 于 预 设 参考 时 间 
段 内 深度 学 习 的 错误 次 数 时 ,采用 差异 组 的 输入 数据 和 真实 结果 数据 对 已 训练 的 深度 学 
习 模 型 进行 训练 。 

具体 来 说 ,可 以 由 计算 数量 与 第 二 预 设 比例 的 乘积 得 到 当前 的 组 数 阔 值 并 存储 。 其 中 ， 
当前 的 组 数 阔 值 大 于 或 等 于 数量 。 本 技术 方案 中 ,第 二 预 设 比例 为 1. 5。 

在 一 个 技术 方案 中 ,网 络 进化 模块 5 将 所 有 差异 组 中 的 输入 数据 输入 已 训练 的 深度 学 
习 模 型 进行 无 监督 学 习 , 得 到 初步 进化 的 深度 学 习 模型 ; 将 所 有 差异 组 中 的 输入 数据 和 对 
应 的 真实 结果 数据 分 别 作为 输入 和 预期 输出 ,对 初步 进化 的 深度 学 习 模型 进行 有 监督 学 习 ， 
得 到 进化 后 的 深度 学 习 模型 。 

在 将 差异 组 中 的 输入 数据 输入 已 训练 的 深度 学 习 模 型 进行 无 监督 学 习 得 到 初步 进化 的 
深度 学 习 模型 的 基础 上 ,再 根据 差异 组 中 的 输入 数据 和 对 应 的 真实 结果 数据 对 初步 进化 的 
深度 学 习 模型 进行 有 监督 学 习 , 结 合 无 监督 学 习 和 有 监督 学 习 , 得 到 的 进化 后 的 深度 学 习 模 
型 更 接近 全 局 最 优 ,偏差 纠正 效果 好 ,从 而 准确 率 更 高 。 

在 一 个 技术 方案 中 ,网 络 进化 模块 5 按照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ,选取 第 一 
差异 组 中 的 输入 数据 输入 已 训练 的 深度 学 习 模 型 进行 无 监督 学 习 , 得 到 对 应 的 训练 深度 学 
习 模 型 ; 选取 下 一 差异 组 中 的 输入 数据 作为 前 一 差异 组 对 应 的 训练 深度 学 习 模 型 的 输入 ， 
对 前 一 差异 组 对 应 的 训练 深度 学 习 模 型 进行 无 监督 学 习 得 到 对 应 的 训练 深度 学 习 模 型 , 循 
环 直 到 得 到 最 后 一 组 差异 组 对 应 的 训练 深度 学 习 模型 并 作为 初步 进化 的 深度 学 习 模型 。 

按照 使 用 时 间 的 先后 顺序 进行 无 监督 学 习 , 后 一 次 无 监督 学 习 在 前 一 次 无 监督 学 习 得 
到 的 训练 深度 学 习 模 型 上 进行 ,从 而 使 用 时 间 越 靠 后 越 接近 将 来 使 用 的 时 间 , 即 越 是 后 输入 
的 数据 越 接近 将 来 的 使 用 时 间 ,而 越 后 输入 的 数据 是 过 去 最 近 的 时 间 产 生 的 数据 ,从 而 使 得 
无 监督 学 习 后 的 深度 学 习 模型 更 能 适应 将 来 使 用 的 需要 。 

在 一 个 技术 方案 中 ,网 络 进化 模块 5 按照 各 差异 组 使 用 时 间 的 先后 顺序 排序 ,选取 第 一 
差异 组 中 的 输入 数据 和 对 应 的 真实 结果 数据 分 别 作为 初步 进化 的 深度 学 习 模 型 的 输入 和 预 
期 输出 ,对 初步 进化 的 深度 学 习 模 型 进行 有 监督 学 习 , 得 到 对 应 的 改进 深度 学 习 模 型 ; 选取 
下 一 差异 组 中 的 输入 数据 和 真实 结果 数据 分 别 作为 前 一 差异 组 对 应 的 改进 深度 学 习 模 型 的 
输入 和 预期 输出 ,对 前 一 差异 组 对 应 的 改进 深度 学 习 模 型 进行 有 监督 学 习 , 得 到 改进 深度 学 习 
模型 ,循环 直到 得 到 最 后 一 组 差异 组 对 应 的 改进 深度 学 习 模 型 并 作为 进化 后 的 深度 学 习 模 型 。 

在 无 监督 学 习 后 的 初步 进化 的 深度 学 习 模型 的 基础 上 ,按照 使 用 时 间 的 先后 顺序 进行 
有 监督 学 习 , 后 一 次 有 监督 学 习 在 前 一 次 有 监督 学 习 得 到 的 改进 深度 学 习 模型 上 进行 ,从 而 
使 用 时 间 越 靠 后 越 接 近 将 来 使 用 的 时 间 , 即 越 是 后 输入 的 数据 越 接近 将 来 的 使 用 时 间 ,而 越 
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后 输入 的 数据 是 过 去 最 近 的 时 间 产 生 的 数据 ,从 而 使 得 最 终 进 化 后 的 深度 学 习 模 型 更 能 适 
应 将 来 使 用 的 需要 ,准确 率 更 高 。 

在 一 个 技术 方案 中 ,上 述 深度 学 习 模 型 进化 装置 包括 清 零 模块 (图 2-8 中 未 说 明 ) ,用 于 
删除 所 有 数据 组 ,将 进化 后 的 深度 学 习 模 型 作为 新 的 已 训练 的 深度 学 习 模 型 ,并 返回 数据 获 
取 模 块 1 重新 调 取 已 训练 的 深度 学 习 模 型 ,将 输入 数据 输入 已 训练 的 深度 学 习 模型 进行 深 
度 学 习 , 得 到 输出 数据 并 记录 使 用 时 间 及 获取 对 应 输入 数据 的 真实 结果 数据 。 如 此 ,可 进行 
清 零 ,避免 存储 的 数据 组 对 下 一 轮 进化 产生 影响 。 

为 更 好 地 说 明 上 述 深 度 学 习 模 型 进化 方法 和 装置 的 处 理 过 程 ,以 下 以 一 个 具体 技术 方 
案 进 行 举例 说 明 。 

预 设 时 间 段 为 从 最 早 的 使 用 时 间 到 现在 为 止 ; 预 设 阔 值 为 0; 组 数 阔 值 为 3。 

比较 进化 知识 库 中 每 组 数据 组 中 输出 数据 与 对 应 的 真实 结果 数据 的 差异 值 ,统计 从 最 
早 的 使 用 时 间 到 现在 为 止 差异 值 大 于 0 的 组 数 , 如 果 组 数 大 于 3, 则 利用 进化 知识 库 中 从 最 
早 的 使 用 时 间 到 现在 为 止 差异 值 大 于 0 的 数据 组 中 输入 数据 和 对 应 的 真实 结果 数据 对 当前 
已 训练 的 深度 学 习 模 型 进行 训练 。 

输入 数据 人 脸 图 像 记 为 IM, 输 出 数据 记 为 OD, 对 应 的 真实 结果 数据 记 为 TD( 为 1 时 
代表 是 张 三 人 脸 ,为 0 时 代表 不 是 张 三 人 脸 ) ,输出 数据 与 对 应 的 真实 结果 数据 的 差异 值 记 
为 DD, 从 最 早 的 使 用 时 间 到 现在 为 止 差异 值 大 于 0 的 组 数 记 为 GS。 

进化 知识 库 中 有 如 下 数据 组 : 

1A 148,IM=A,OD=1.TD=1,DD=0,GS=0 

2A 1 A.IM=B,OD=1,TD=1,.DD=0.GS=0, 
3A 1 A.IM=C,OD=0,TD=0,.DD=0.GS=0. 

0 
1 
1 
1 


4H 1H,IM=D,OD=0,.TD=0,DD=0,.GS=0. 

5 A 14A,IM=E,OD=1,TD=0,DD>0,GS=1, 

6A 1 A.IM=F,OD=0,TD=0,DD=0.GS 

7A 148,.IM=G,OD=1,TD=1,DD=0,GS 

8A 1 A.IM=H,OD=0,.TD=1,DD>0,GS=2. 

9A 1 48,IM=I,OD=1,TD=1,DD=0,GS=2, 

10 月 1 8. IM=J,OD=0,.TD=1,DD>0,GS=3. 

11 A 1 A.IM=K.OD=1.TD=0,DD>0.GS=4, 

此 时 从 最 早 的 使 用 时 间 到 现在 为 止 差异 值 大 于 0 的 组 数 4 大 于 3, 则 利用 进化 知识 库 
中 从 最 早 的 使 用 时 间 到 现在 为 止 差异 值 大 于 0 的 数据 组 中 输入 数据 和 对 应 的 真实 结果 数据 
对 当前 已 训练 的 深度 学 习 模 型 进行 训练 。 

初始 的 深度 学 习 模 型 记 为 M0。 先 进行 无 监督 学 习 , 将 输入 数据 人 脸 图 像 ( 记 为 IM) 输 
入 当前 已 训练 的 深度 学 习 模 型 ( 记 为 PM) ,对 当前 已 训练 的 深度 学 习 模 型 进行 无 监督 学 习 ， 
得 到 训练 深度 学 习 模 型 ( 记 为 CM): 

5 月 1 日 ,IM=E。 PM=M0.CM=M0501, 

8H 1A.IM=H., PM=M0501-CM=M0801. 

10 月 1 A.IM=J, PM=M0801,CM=M1001, 

11 A 1H.IM=K, PM=M1001.CM=M1101, 
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然后 进行 有 监督 学 习 , 将 输入 数据 人 脸 图 像 ( 记 为 IM) 、 对 应 的 真实 结果 数据 ( 记 为 
TD) 作 为 初步 进化 的 深度 学 习 模 型 的 输入 和 期 望 输出 ,对 初步 进化 的 深度 学 习 模 型 ( 记 为 
PN) 进 行 有 监督 学 习 , 得 到 改进 深度 学 习 模 型 ( 记 为 CN) : 

5 1 A.IM=E,TD=0, PN=M1001,CN=NO0501, 

8 1 A.IM=H,TD=1, PN=N0501,CN=N0801. 

10 月 1 A,IM=J,TD=1, PN=N0801,CN=N1001, 

114 148,IM=K,TD=0, PN=N1001.CN=N1101, 


适应 型 深度 学 习 模 型 


深度 学 习 模 型 不 是 万 能 的 ,在 有 些 场景 或 应 用 中 会 出 现 局 限 性 ,因此 需要 提高 现 有 深度 
学 习 模型 的 适应 性 。 本 章 给 出 了 两 种 适应 型 深度 学 习 模型 : 期 望 与 反 期 望 深度 学 习 模 型 、 
残缺 数据 深度 学 习 模型 。 


3.1 ”期望 与 反 期 望 深度 学 习 模 型 


深度 学 习 模 型 通过 输入 数据 和 输出 数据 对 深度 学 习 模 型 进行 训练 。 如 果 有 的 输入 
数据 在 不 同 场景 下 能 产生 属性 相反 的 输出 数据 (这 是 有 可 能 的 ,假如 还 有 影响 输出 结 
果 的 其 他 条 件数 据 没 有 包括 在 输入 数据 中 ,那么 就 有 可 能 因为 其 他 条 件数 据 的 变化 ， 
而 产生 不 同 的 输出 数据 ) ,此 时 就 会 在 训练 过 程 中 引起 深度 学 习 模型 结构 的 动荡 ,不利 
于 深度 学 习 模 型 的 训练 ,也 不 利于 深度 学 习 模型 的 使 用 ,因为 无 法 得 知 输出 数据 的 可 
信和 度 是 多 少 P29 。 

例如 ,深度 学 习 模 型 判断 一 个 人 是 不 是 男 的 ,输入 不 同人 的 人 脸 特 征 , 同 样 脸 部 特 
征 的 人 可 能 是 男 的 ,也 可 能 是 女 的 ,此 时 就 会 在 训练 过 程 中 引起 深度 学 习 模型 结构 的 
动荡 。 

本 技术 研究 并 给 出 了 一 种 新 的 期 望 与 反 期 望 深度 学 习 方法 和 神经 网 络 系统 ,通过 输 
出 数据 的 期 望 标签 和 反 期 望 标签 构造 两 个 深度 学 习 模型 ,分别 对 与 期 望 标签 对 应 的 深度 
学 习 模 型 和 与 反 期 望 标签 对 应 的 深度 学 习 模 型 进行 训练 ,避免 了 深度 学 习 模型 当 存 在 属 
性 相反 的 输出 数据 时 结构 动荡 的 问题 ,提高 了 深度 学 习 模 型 训练 的 可 靠 性 。 
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3.1.1 期 望 与 反 期 望 深度 学 习 方 法 


如 图 3-1 所 示 ,本 技术 方案 提供 一 种 期 望 与 反 期 望 深度 学 习 方 法 ,可 包括 以 下 步骤 : 


步 又 S1 : 获取 训练 数据 中 输出 数据 的 期 望 标 答 和 反 期 望 标签 ; 其 中 ， 反 期 望 标签 是 
与 期 望 标签 的 属性 相反 的 标签 


| 


步骤 S2 : 初始 化 与 期 望 标签 对 应 的 深度 学 习 模型 ， 得 到 期 望 深度 学 习 模 型 ， 初 始 化 
与 反 期 望 标签 对 应 的 深度 学 习 模 型 ， 得 到 反 期 望 深度 学 习 模型 


| 


步骤 S3 : 分 别 对 期 望 深度 学 习 模型 和 反 期 望 深度 学 习 模型 进行 训练 


图 3-1 期 望 与 反 期 望 深度 学 习 方法 流程 


(1) 步骤 S1 ,获取 训练 数据 中 输出 数据 的 期 望 标签 和 反 期 望 标签 ; 其 中 , 反 期 望 标签 是 
与 期 望 标签 的 属性 相反 的 标签 。 

例如 ,获取 输出 数据 的 期 望 标签 "男人 ”, 反 期 望 标签 "女人 ”。 

(2) 步骤 S2 ,初始 化 与 期 望 标签 对 应 的 深度 学 习 模型 ,得 到 期 望 深度 学 习 模型 ; 初始 化 
与 反 期 望 标签 对 应 的 深度 学 习 模型 ,得 到 反 期 望 深度 学 习 模型 。 

其 中 ,期 望 标签 对 应 的 深度 学 习 模型 的 输入 格式 初始 化 为 训练 数据 中 的 输入 数据 格式 ; 
反 期 望 标签 对 应 的 深度 学 习 模 型 的 输入 格式 也 初始 化 为 训练 数据 中 的 输入 数据 格式 。 期 户 
深度 学 习 模 型 的 输出 格式 初始 化 为 0 一 1 之 间 的 数 , 输 出 为 1 时 ,表示 输出 为 期 望 标签 ; 输 
出 为 0 时 ,表示 输出 不 是 期 望 标签 ; 输出 为 0 一 1 时 ,表示 输出 有 可 能 是 期 望 标签 。 反 期 望 
深度 学 习 模 型 的 输出 格式 初始 化 为 0 一 1 的 数 ,输出 为 1 时 ,表示 输出 为 反 期 望 标签 ; 输出 
为 0 时 ,表示 输出 不 是 反 期 望 标 签 ; 输出 为 0 一 1 时 ,表示 输出 有 可 能 是 反 期 望 标签 。 同 时 ， 
获取 已 有 同类 深度 学 习 模 型 的 配置 信息 ( 预 设 配置 信息 包括 : 预 设 层 数 、 每 层 预 设 节点 数 、 
各 网 络 连接 的 预 设 权 值 ) 作 为 期 望 标签 对 应 的 深度 学 习 模型 的 配置 信息 对 期 望 标签 对 应 的 
深度 学 习 模 型 进行 配置 ,同时 也 将 该 配置 信息 作为 反 期 望 标签 对 应 的 深度 学 习 模型 的 配置 
信息 对 反 期 望 标签 对 应 的 深度 学 习 模 型 进行 配置 。 

例如 ,初始 化 与 期 望 标签 "男人 ”和 反 期 望 标签 "女人 ?对 应 的 两 个 深度 学 习 模 型 , 称 为 期 
望 标签 “男人 ”深度 学 习 模 型 . 反 期 望 标签 "女人 ”深度 学 习 模 型 。 

(3) 步 又 S3 ,分 别 对 期 望 深度 学 习 模型 和 反 期 望 深度 学 习 模 型 进行 训练 。 

在 一 个 技术 方案 中 ,本 步骤 可 以 采用 以 下 方式 实现 : 

步骤 S3-1, 通 过 训练 数据 中 的 输入 数据 分 别 对 期 望 深度 学 习 模型 和 反 期 望 深度 学 习 
模型 进行 无 监督 训练 。 

例如 ,通过 训练 数据 中 的 输入 数据 人 脸 图 像 分 别 对 期 望 标签 “男人 ”深度 学 习 模 型 . 反 期 
望 标签 “女人 ”深度 学 习 模 型 进行 无 监督 训练 。 对 期 望 深度 学 习 模 型 \、 反 期 望 深度 学 习 模 型 
进行 无 监督 训练 ,可 采用 同样 的 输入 数据 集合 。 
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@ 步骤 S3-2, 从 训练 数据 中 获取 与 期 望 标签 一 致 的 输出 标签 对 应 的 输入 数据 ,将 该 输 
入 数据 作为 输入 ,将 1” 作为 预期 输出 ,对 期 望 深度 学 习 模型 进行 有 监督 训练 ,并 从 训练 数据 
中 获取 与 期 望 标签 及 反 期 望 标签 都 不 一 致 的 输出 标签 对 应 的 输入 数据 ,将 该 输入 数据 作为 
输入 ,将 “0” 作 为 预期 输出 ,对 期 望 深度 学 习 模 型 进行 有 监督 训练 。 

可 以 将 训练 数据 中 与 期 望 标签 一 致 的 输出 标签 对 应 的 输入 数据 作为 第 一 输入 数据 ; 从 
第 一 输入 数据 中 筛选 出 第 一 预 设 比例 (假设 为 P%,P 为 0~100 的 实数 ) 的 第 一 输入 数据 ， 
得 到 对 应 的 每 一 第 二 输入 数据 (即将 第 一 输入 数据 中 P% 的 数据 保留 ,其 余数 据 清空 ,得 到 
对 应 的 每 一 第 二 输入 数据 ); 将 每 一 第 二 输入 数据 作为 输入 ,将 第 一 预 设 比例 作为 预期 输 
出 ,对 期 望 深度 学 习 模 型 进行 有 监督 训练 。 

之 所 以 不 进行 从 训练 数据 中 获取 与 反 期 望 标签 一 致 的 输出 标签 对 应 的 输入 数据 ,将 该 
输入 数据 作为 输入 ,将 0” 作为 预期 输出 ,对 期 望 深度 学 习 模 型 进行 有 监督 训练 ,是 因为 与 反 
期 望 标签 一 致 的 输出 标签 所 对 应 的 输入 数据 有 可 能 与 期 望 标签 一 致 的 输出 标签 所 对 应 的 输 
入 数据 类 似 (例如 ,有 的 男人 和 女人 的 脸 部 特征 很 相像 ), 从 而 导致 类 似 的 输入 数据 在 同一 个 
深度 学 习 模型 中 产生 不 同 的 输出 标签 ,进而 会 对 期 望 深 度 学 习 模 型 的 训练 效果 产生 负面 
影响 。 

例如 ,从 训练 数据 中 获取 与 期 望 标签 "男人 ”一 致 的 输出 标签 (预期 输出 为 *1”) 及 其 对 应 
输入 数据 人 脸 图 像 对 期 望 标签 "男人 ”深度 学 习 模 型 进行 有 监督 训练 ; 从 训练 数据 中 获取 与 
期 望 标签 "男人 ”及 反 期 望 标签 "女人 ?都 不 一 致 的 输出 标签 (预期 输出 为 "0”) 及 其 对 应 输入 
数据 (例如 动物 头像 ) 对 期 望 标签 "男人 ?深度 学 习 模 型 进行 有 监督 训练 ; 从 训练 数据 中 获取 
与 期 望 标签 “男人” 一致 的 输出 标签 (预期 输出 为 *1”) 及 其 对 应 输入 数据 人 脸 图 像 , 将 输入 数 
据 人 脸 图 像 中 60% 的 部 分 保留 (可 随机 选择 ,也 可 以 均匀 选择 ,或 按照 一 定 预 设 方式 选择 需 
要 保留 的 部 分 ) ,其 余 40% 的 部 分 从 图 像 中 清除 (可 随机 选择 ,也 可 以 均匀 选择 ,或 按照 一 定 
预 设 方式 选择 需要 保留 的 部 分 ) ,然后 将 处 理 后 的 输入 数据 人 脸 图 像 作为 新 输入 数据 人 脸 图 
像 ,将 输出 数据 "1” 变 为 新 输出 数据 *60%”, 对 期 望 标签 “男人 ”深度 学 习 模 型 进行 有 监督 
训练 。 

@ 步骤 S3-3, 从 训练 数据 中 获取 与 反 期 望 标签 一 致 的 输出 标签 对 应 的 输入 数据 ,将 该 
输入 数据 作为 输入 ,将 "1 作为 预期 输出 ,对 反 期 望 深 度 学 习 模型 进行 有 监督 训练 ,并 从 训练 
数据 中 获取 与 期 望 标签 及 反 期 望 标签 都 不 一 致 的 输出 标签 对 应 的 输入 数据 ,将 该 输入 数据 
作为 输入 ,将 “0” 作 为 预期 输出 ,对 反 期 望 深度 学 习 模 型 进行 有 监督 训练 。 

可 以 将 训练 数据 中 与 反 期 望 标签 一 致 的 输出 标签 对 应 的 输入 数据 作为 第 三 输入 数据 ; 
从 每 一 第 三 输入 数据 中 筛选 出 第 二 预 设 比例 (假设 为 P%,P O~ 100 的 实数 ) 的 数据 ,得 
到 对 应 的 每 一 第 四 输入 数据 (即将 每 一 第 三 输入 数据 中 P% 的 数据 保留 ,其 余数 据 清空 ,得 
到 对 应 的 每 一 第 四 输入 数据 ); 将 每 一 第 四 输入 数据 作为 输入 ,将 对 应 的 第 二 预 设 比例 作为 
预期 输出 ,对 反 期 望 深度 学 习 模型 进行 有 监督 训练 。 

例如 ,从 训练 数据 中 获取 与 反 期 望 标签 “女人 ”一 致 的 输出 标签 (预期 输出 为 *1”) 及 其 对 
应 输入 数据 人 脸 图 像 对 反 期 望 标签 “女人 ?深度 学 习 模 型 进行 有 监督 训练 ; 从 训练 数据 中 获 
取 与 期 望 标签 "男人 ”及 反 期 望 标签 "女人 ?都 不 一 致 的 输出 标签 (预期 输出 为 "07) 及 其 对 应 
输入 数据 (例如 动物 头像 ) 对 期 望 标签 "女人 ?深度 学 习 模 型 进行 有 监督 训练 。 

从 训练 数据 中 获取 与 反 期 望 标签 “女人 ”一 致 的 输出 标签 (预期 输出 为 *1”) 及 其 对 应 输 
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入 数据 人 脸 图 像 ,将 输入 数据 人 脸 图 像 中 60% 的 部 分 保留 (可 随机 选择 ,也 可 以 均匀 选择 ， 
或 按照 一 定 预 设 方式 选择 需要 保留 的 部 分 ) ,其 余 40% 的 部 分 从 图 像 中 清除 (可 随机 选择 ， 
也 可 以 均匀 选择 ,或 按照 一 定 预 设 方式 选择 需要 保留 的 部 分 ) ,然后 将 处 理 后 的 输入 数据 人 
脸 图 像 作为 新 输入 数据 人 脸 图 像 ,将 输出 数据 *1” 变 为 新 输出 数据 "60%”, 对 反 期 望 标签 “ 女 
人 ”深度 学 习 模 型 进行 有 监督 训练 。 

在 分 别 对 期 望 深度 学 习 模 型 和 反 期 望 深度 学 习 模 型 进行 训练 之 后 ,还 可 以 计算 输入 数 
据 对 应 的 输出 属于 期 望 标签 及 反 期 望 标签 的 可 信和 度 。 可 以 将 输入 数据 输入 期 望 深度 学 习 模 
型 ,得 到 期 望 深度 学 习 模型 的 输出 数据 ; 将 输入 数据 输入 反 期 望 深度 学 习 模型 ,得 到 反 期 望 
深度 学 习 模 型 的 输出 数据 ; 根据 期 望 深度 学 习 模 型 与 反 期 望 深度 学 习 模 型 的 输出 数据 得 到 
输入 数据 对 应 的 输出 属于 期 望 标签 及 反 期 望 标 签 的 可 信和 度 。 

例如 ,获取 输入 数据 人 脸 图 像 .将 输入 数据 人 脸 图 像 输入 期 望 深度 学 习 模 型 ,得 到 期 望 
深度 学 习 模 型 的 输出 数据 ,该 输出 数据 为 0 一 1 的 数 , 越 接 近 1, 则 表明 输出 为 期 望 标签 的 概 
率 越 大 ; 将 输入 数据 输入 反 期 望 深度 学 习 模 型 ,得 到 反 期 望 深 度 学 习 模 型 的 输出 数据 ,该 输 
出 数据 为 0 一 1 的 数 , 越 接 近 1, 则 表明 输出 为 反 期 望 标签 的 概率 越 大 。 

在 计算 可 信和 度 时 ,可 以 将 期 望 深度 学 习 模 型 的 输出 数据 作为 输出 属于 期 望 标签 的 概率 
记 为 A, 将 反 期 望 深度 学 习 模型 的 输出 数据 作为 输出 属于 反 期 望 标签 的 概率 记 为 B; 将 输 
和 数据 对 应 的 输出 属于 期 望 标签 或 反 期 望 标签 的 可 信和 度 记 为 下 , 则 =(A 十 B)/2; 输入 数 
据 对 应 的 输出 属于 期 望 标签 的 可 信和 度 为 FxA, 属 于 相反 标签 的 可 信和 度 为 FXxB, 属 于 其 他 
标签 的 可 信和 度 为 1 一 F。 

例如 ,如 果 这 个 人 是 男人 ,那么 这 个 人 是 男人 的 概率 是 下 XA, 作 为 这 个 人 是 男人 的 可 
信和 度 ; 是 女人 的 概率 是 下 XB, 作 为 这 个 人 是 女人 的 可 信和 度 ; 属于 其 他 标签 的 概率 为 1 一 下 ， 
作为 这 个 人 既 不 是 男人 又 不 是 女人 的 可 信 度 。 

深度 学 习 模型 判断 一 个 人 是 不 是 男人 ,训练 数据 中 输入 头像 图 像 , 如 果 训 练 数据 中 输出 数 
据 是 男人 , 则 用 “男人 ”标签 对 应 的 深度 学 习 模 型 进行 训练 ,例如 用 输出 *1” 代 表 是 男人 ,用 “0” 
代表 不 是 男人 (例如 是 动物 ); 如 果 训 练 数据 中 输出 数据 是 女人 , 则 用 “女人 ”标签 对 应 的 深度 
学 习 模型 进行 训练 ,例如 用 输出 用 0 一 1 的 数 来 代表 是 女人 的 可 能 性 大 小 ,用 1 代表 是 女人 ,用 
0 代表 不 是 女人 (例如 是 动物 ); 如 果 训 练 数 据 中 输出 数据 是 跟 男人 、 女 人 无 关 的 ,例如 动物 , 则 
“男人 ”标签 对 应 的 深度 学 习 模 型 和 “女人 ”标签 对 应 的 深度 学 习 模 型 同时 进行 训练 。 

在 使 用 时 ,输入 一 个 数据 到 “男人 ”和 “女人 ”标签 对 应 的 深度 学 习 模 型 同时 计算 ,如 果 
“男人 ”标签 对 应 的 深度 学 习 模 型 输出 0.8; 如 果 “ 女 人 ”标签 对 应 的 深度 学 习 模 型 输出 0. 5， 
则 输出 是 “男人 ”或 “女人 ”的 可 信和 度 是 (0. 8 十 0. 5) /2=0. 65 二 65% ,输出 不 是 “男人 ”或 “ 女 
人 ”的 可 信和 度 是 1— 65% = 35% ,输出 是 “男人 ”的 可 信和 度 是 65%X0. 8= 52% ,输出 是 “女人 ” 
的 可 信和 度 是 65% X0.5= 32.5% ,相对 而 言 是 “男人 ”的 可 信和 度 更 高 ,所 以 判断 为 “男人 ”。 


3.1.2 期望 与 反 期 望 深度 学 习 系 统 


如 图 3-2 所 示 , 本 技术 方案 还 提供 一 种 神经 网 络 系 统 ,可 包括 : 
(1) 标签 获取 模块 1, 用 于 获取 训练 数据 中 输出 数据 的 期 望 标签 和 反 期 望 标签 ; 其 中 ， 


2 妆 据 处 理 与 深度 学 习 | 


反 期 望 标签 是 与 期 望 标签 的 属性 相反 的 标签 。 中 [可 fy 
例如 ,获取 输出 数据 的 期 望 标签 "男人 ”和 反 期 望 标 a| |e} |e 

签 < 女人 ”。 内 | | 父 || 央 
(2) 初始 化 模块 2, 用 于 初始 化 与 期 望 标签 对 应 的 深 *) |2 

度 学 习 模 型 ,得 到 期 望 深度 学 习 模 型 ,初始 化 与 反 期 望 标 

签 对 应 的 深度 学 习 模 型 ,得 到 反 期 望 深度 学 习 模型 。 Ace ES eae 


其 中 ,期 望 标签 对 应 的 深度 学 习 模型 的 输入 格式 初始 化 为 训练 数据 中 的 输入 数据 格式 ; 
反 期 望 标签 对 应 的 深度 学 习 模 型 的 输入 格式 也 初始 化 为 训练 数据 中 的 输入 数据 格式 。 期 望 
深度 学 习 模 型 的 输出 格式 初始 化 为 0 一 1 的 数 ,输出 为 “1” 时 ,表示 输出 为 期 望 标 签 ; 输出 为 
“0” 时 ,表示 输出 不 是 期 望 标签 ; 输出 为 0 一 1 的 数 时 ,表示 输出 有 可 能 是 期 望 标签 。 反 期 望 
深度 学 习 模 型 的 输出 格式 初始 化 为 0 一 1 的 数 ,输出 为 "1? 时 ,表示 输出 为 反 期 望 标签 ,输出 
为 “0? 时 ,表示 输出 不 是 反 期 望 标签 ; 输出 为 0 一 1 的 数 时 ,表示 输出 有 可 能 是 反 期 望 标签 。 
同时 ,获取 已 有 同类 深度 学 习 模 型 的 配置 信息 ( 预 设 配置 信息 包括 : 预 设 层 数 、 每 层 预 设 节 
点 数 . 各 网 络 连接 的 预 设 权 值 ) 作 为 期 望 标签 对 应 的 深度 学 习 模型 的 配置 信息 对 期 望 标签 对 
应 的 深度 学 习 模型 进行 配置 ,同时 也 将 该 配置 信息 作为 反 期 望 标签 对 应 的 深度 学 习 模型 的 
配置 信息 对 反 期 望 标签 对 应 的 深度 学 习 模 型 进行 配置 。 

例如 ,初始 化 与 期 望 标签 "男人 ”和 反 期 望 标签 "女人 ?对 应 的 两 个 深度 学 习 模 型 , 称 为 期 
望 标签 “男人 ”深度 学 习 模型 . 反 期 望 标签 “女人 ”深度 学 习 模 型 。 

(3) 训练 模块 3, 用 于 分 别 对 期 望 深度 学 习 模型 和 反 期 望 深度 学 习 模 型 进行 训练 。 

本 技术 方案 通过 输出 数据 的 期 望 标 签 和 反 期 望 标签 构造 两 个 深度 学 习 模型 ,如 果 训 练 
数据 中 输出 数据 与 期 望 标签 一 致 , 则 对 与 期 望 标签 对 应 的 深度 学 习 模 型 进行 训练 ; 如 果 训 
练 数据 中 输出 数据 与 反 期 望 标签 一 致 , 则 对 与 反 期 望 标签 对 应 的 深度 学 习 模 型 进行 训练 ; 
如 果 训 练 数据 中 输出 数据 与 属性 无 关 ( 当 然 也 与 反 期 望 标签 无 关 ), 则 同时 对 期 望 标签 及 反 
期 望 标签 对 应 的 两 个 深度 学 习 模型 进行 训练 。 训 练 得 到 两 个 深度 学 习 模 型 ,在 应 用 中 将 输 
和 数据 同时 输入 这 两 个 深度 学 习 模 型 ,得 到 两 个 输出 数据 ,然后 综合 这 两 个 输出 数据 得 到 输 
出 数据 属于 期 望 标签 及 反 期 望 标签 的 可 信和 度 。 

本 技术 方案 的 神经 网 络 系统 与 期 望 和 反 期 望 深度 学 习 方 法 一 一 对 应 ,上 述 期 望 与 反 期 
望 深度 学 习 方法 的 技术 方案 阐述 的 技术 特征 及 其 有 益 效 果 均 适用 于 神经 网 络 系统 的 技术 方 
案 中 。 


3.2 残缺 深度 学 习 模 型 


人 工 神经 网 络 (Artificial Neural Network, ANN) 也 简称 为 神经 网 络 或 连接 模型 , 它 是 
一 种 模仿 动物 神经 网 络 行为 特征 ,进行 分 布 式 并 行 信息 处 理 的 算法 数学 模型 。 这 种 网 络 依 
靠 系统 的 复杂 程度 ,通过 调整 内 部 大 量 节点 之 间 的 相互 连接 关系 ,从 而 达到 处 理 信息 的 
目的 。 

传统 技术 中 ,神经 网 络 包括 用 于 深度 学 习 的 神经 网 络 都 是 通过 输入 数据 和 输出 数据 对 
神经 网 络 进行 训练 ,然后 在 使 用 阶段 将 输入 数据 输入 已 经 训练 好 的 神经 网 络 , 从 而 得 到 输出 
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数据 。 但 是 ,在 实际 使 用 过 程 中 ,输入 数据 往往 都 不 完整 ,因此 基于 传统 技术 的 神经 网 络 无 
法 根据 不 完整 的 输入 数据 得 到 输出 数据 9。 

本 技术 方案 研究 并 给 出 了 一 种 新 型 的 残缺 数据 深度 学 习 模型 方法 、 系 统 , 方 法 包括 : 获 
取 预 先 训练 好 的 深度 学 习 模 型 ; 从 待 预 测 数据 中 获取 输入 数据 ; 根据 输入 数据 和 预先 训练 
好 的 深度 学 习 模型 的 输入 变量 确定 至 少 一 个 缺少 数据 的 输入 变量 ; 将 对 缺少 数据 的 输入 变 
量 进 行 赋值 获得 的 数据 ,与 从 待 预测 数据 中 获取 的 输入 数据 进行 组 合 , 生 成 多 组 完整 输入 数 
据 ; 将 多 组 完整 输入 数据 输入 到 预先 训练 好 的 深度 学 习 模 型 中 ,计算 得 到 多 组 输出 数据 。 
通过 这 种 方式 ,在 输入 数据 缺少 数据 的 情况 下 .仍然 能 够 通过 神经 网 络 输出 预测 的 输出 变 
量 ,为 研究 工作 提供 数据 支持 ,减少 了 输入 数据 检测 和 采集 的 成 本 。 


3.2.1 残缺 深度 学 习 模 型 方法 


1. 残缺 深度 学 习 模型 的 基本 方法 
如 图 3-3 所 示 ,本 技术 方案 提供 了 一 种 深度 学 习 模型 方法 ,该 方法 以 应 用 于 服务 器 进行 
举例 说 明 。 包 括 : 


步骤 S1 : 获取 预先 训练 好 
的 深度 学 习 神经 模型 


步骤 S2: 从 待 预测 数据 中 获取 输入 数据 | 


了 
步骤 S3 : 根据 输入 数据 和 预先 训练 好 
的 深度 学 习 神经 模型 的 输入 变量 确 
定 至 少 一 个 缺少 数据 的 输入 变量 


——— 

BPRS : 将 对 缺少 数据 的 输入 变量 进 

行 赋值 获得 的 数据 ， 与 从 待 预测 数 

据 中 获取 的 输入 数据 进行 组 合 ， 生 
成 多 组 完整 输入 数据 


了 


步骤 S5 : 将 多 组 完整 输入 数据 输入 到 
预先 训练 好 的 深度 学 习 神经 模型 中 ， 
计算 得 到 多 组 输出 数据 


图 3-3 深度 学 习 模型 方法 的 流程 示意 图 


(1) 步骤 S1, 获 取 预 先 训练 好 的 深度 学 习 模 型 。 

(2) 步骤 S2, 从 待 预测 数据 中 获取 输入 数据 。 

(3) 步骤 S3, 根 据 输入 数据 和 预先 训练 好 的 深度 学 习 模型 的 输入 变量 确定 至 少 一 个 缺 
少数 据 的 输入 变量 。 

预先 训练 好 的 深度 学 习 模 型 有 N 个 输入 变量 。 待 预测 数据 中 有 其 中 M 个 输入 变量 对 
应 的 数据 ,其 余 N 一 M 个 输入 变量 没有 对 应 的 数据 , 则 这 N 一 M 个 输入 变量 是 缺少 数据 的 
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输入 变量 ; 其 中 ,M、N 为 自然 数 。 

例如 ,深度 学 习 模 型 输入 变量 为 : 身高 体重、 血压 、 血 液 检查 结果 、 尿 液 检查 结果 ; 深 
度 学 习 模 型 输出 是 糖尿 病 类 型 (例如 ,用 0、1、2、3 来 表示 不 同类 型 的 糖尿 病 ) 。 

待 测试 的 不 完整 输入 数据 包括 血压 数据 、 血 液 检 查 结果 数据 、 尿 液 检 查 结果 数据 ,缺少 
数据 输入 变量 为 身高 体重。 

(4) 步骤 S4, 将 对 缺少 数据 的 输入 变量 进行 赋值 获得 的 数据 ,与 从 待 预 测 数 据 中 获取 
的 输入 数据 进行 组 合 , 生 成 多 组 完整 输入 数据 。 

通过 知识 库 获 取 缺 少数 据 的 输入 变量 中 每 一 缺少 数据 的 输入 变量 的 取 值 范围 。 具 体 包 
括 3 种 方式 : 

第 1 种 方式 : 从 输入 变量 范围 知识 库 中 检索 出 缺少 数据 输入 变量 对 应 的 预 设 取 值 范 
围 ; 其 中 ,输入 变量 范围 知识 库 预 先 存 有 所 有 输入 变量 对 应 的 预 设 取 值 范围 。 

第 2 种 方式 : 提示 并 接受 用 户 输入 缺少 数据 输入 变量 的 预 设 取 值 范围 。 

第 3 种 方式 : 从 每 一 训练 输入 数据 中 获取 缺少 数据 输入 变量 的 值 ,统计 获取 到 的 缺少 
数据 输入 变量 的 最 大 值 和 最 小 值 . 将 最 小 值 到 最 大 值 的 范围 作为 缺少 数据 输入 变量 的 预 设 
取 值 范围 。 

例如 ,身高 的 取 值 范围 是 0.1 一 2m, 体 重 的 取 值 范围 是 2 一 100kg。 

知识 库 中 存储 有 多 组 数据 ,其 中 包括 多 组 预先 训练 好 的 深度 学 习 模 型 输入 数据 。 可 通 
过 知识 库 中 存储 的 数据 获取 缺少 数据 输入 数据 的 取 值 范围 。 

对 缺少 数据 输入 变量 在 对 应 的 预 设 取 值 范围 内 进行 N 次 赋值 ,具体 包括 两 种 实现 方法 : 

第 1 种 实现 方法 : 对 缺少 数据 输入 变量 在 对 应 的 预 设 取 值 范围 内 随机 地 取 N 个 值 对 
缺少 数据 输入 变量 进行 N 次 赋值 。 

第 2 种 实现 方法 : 从 所 有 训练 输入 数据 中 随机 抽取 N 个 训练 输入 数据 ,然后 提取 其 中 
该 输入 变量 对 应 的 数据 对 缺少 数据 输入 变量 进行 N 次 随机 赋值 。 

其 中 , 预 设 次 数 N 的 确定 方法 包括 : 

接受 用 户 输入 预 设 次 数 N 的 值 ,如 果 用 户 没 有 输入 , 则 将 训练 输入 数据 的 数量 作为 N 
的 值 。 

例如 ,对 缺少 数据 输入 变量 身高 .体重 在 对 应 的 预 设 取 值 范围 0.1 一 2m .2 一 100kg 内 复 
制 其 他 样本 中 该 输入 变量 数据 进行 100 次 随机 赋值 ,因为 在 很 多 样本 中 是 具备 身高 .体重 数 
据 的 ,所 以 通过 获取 已 有 其 他 样本 中 这 些 输入 变量 的 数据 是 可 行 的 : 

身高 0. 5m, 体 重 10kg; 

身高 1. 5m, 体 重 50kg; 

身高 1. 7m, 体 重 55kg; 

将 该 缺少 数据 输入 变量 身高 .体重 对 应 的 100 份 输入 数据 与 待 测试 的 不 完整 输入 数据 
“血压 数据 C、 血 液 检查 结果 数据 DD、 尿 液 检查 结果 数据 E” 组 合 得 到 100 份 完整 的 输入 
数据 : 

身高 0. 5m, 体 重 10kg; 血 压 数 据 C, 血 液 检查 结果 数据 DD, 尿 液 检查 结果 数据 Es 

身高 1. 5m, 体 重 50kg, 血 压 数 据 C, 血 液 检查 结果 数据 DD, 尿 液 检 查 结果 数据 已 ; 
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身高 1. 7m ,体重 55kg, 血 压 数据 C, 血 液 检查 结果 数据 DD, 尿 液 检查 结果 数据 E。 

通过 知识 库 中 存储 的 数据 获取 缺少 输入 数据 的 取 值 范围 后 ,在 此 取 值 范围 内 取 预 定数 
量 的 数据 ,将 选取 的 数据 赋值 给 缺少 数据 的 输入 变量 。 预 定数 量 是 预先 设置 的 数量 值 , 可 根 
据 不 同 的 输入 变量 设 定 不 同 的 预定 数量 。 选 择 M 个 数量 的 数据 对 缺少 数据 的 输入 变量 进 
行 赋值 ,就 能 得 到 M 个 缺少 数据 的 输入 变量 的 输入 数据 ,再 将 填 人 了 数据 的 缺少 数据 的 输 
入 变量 与 从 待 预测 数据 中 获取 的 输入 数据 进行 组 合 ,生成 多 组 完整 的 输入 数据 。 

(5) 步骤 S5 ,将 多 组 完整 输入 数据 输入 到 预先 训练 好 的 深度 学 习 模型 中 ,计算 得 到 多 
组 输出 数据 。 

将 缺少 数据 的 输入 变量 缺少 数据 的 输入 数据 补充 完整 后 ,与 从 待 预 测 数据 中 获取 的 输 
入 数据 进行 组 合 ,生成 多 组 完整 的 输入 数据 。 再 将 多 组 完整 的 输入 数据 输入 到 预先 训练 好 
的 深度 学 习 模 型 中 , 则 能 够 获得 多 个 输出 数据 。 

例如 ,将 100 份 完整 的 输入 数据 输入 已 训练 的 深度 学 习 模 型 ,得 到 多 份 输出 : 

身高 0. 5m, 体 重 10kg, 血 压 C, 血 液 检查 结果 DD, 尿 液 检查 结果 Es 该 份 完整 的 输入 数 
据 输 入 已 训练 的 深度 学 习 模 型 得 到 输出 Y, ; 

身高 1. 5m, 体 重 50kg, 血 压 C, 血 液 检查 结果 DD, 尿 液 检查 结果 Es 该 份 完整 的 输入 数 
据 输入 已 训练 的 深度 学 习 模 型 得 到 输出 Ys 

身高 1. 7m, 体 重 55kg, 血 压 C, 血 液 检查 结果 DD, 尿 液 检查 结果 EE; 该 份 完整 的 输入 数 
据 输入 已 训练 的 深度 学 习 模型 得 到 输出 ao 。 

通过 这 种 方式 ,在 输入 数据 缺少 数据 的 情况 下 ,仍然 能 够 通过 神经 网 络 输出 预测 的 输出 
变量 ,为 研究 工作 提供 数据 支持 。 

2. 残缺 深度 学 习 模 型 的 详细 方法 

在 一 个 技术 方案 中 ,将 对 缺少 数据 的 输入 变量 进行 赋值 获得 的 数据 ,与 从 待 预测 数据 中 
获取 的 输入 数据 进行 组 合 ,生成 多 组 完整 输入 数据 ,包括 : 从 输入 变量 范围 知识 库 中 检索 出 
缺少 数据 输入 变量 对 应 的 预 设 取 值 范围 ,其 中 ,输入 变量 范围 知识 库 预先 存 有 所 有 输入 变量 
对 应 的 预 设 取 值 范围 ; 或 从 每 一 训练 输入 数据 中 获取 缺少 数据 输入 变量 的 值 ,统计 获取 忽 
少数 据 输入 变量 的 最 大 值 和 最 小 值 , 将 从 最 小 值 到 最 大 值 之 间 值 的 范围 作为 缺少 数据 输入 
变量 的 预 设 取 值 范围 ; 或 提示 并 接受 用 户 输入 缺少 数据 输入 变量 的 预 设 取 值 范围 ,对 缺少 
数据 输入 变量 在 对 应 的 预 设 取 值 范围 内 随机 地 生成 预定 数量 个 值 对 缺少 数据 的 输入 变量 进 
行 预定 数量 次 赋值 ,其 中 ,预定 数量 由 用 户 输入 或 预先 设置 。 

当 待 预测 数据 中 缺少 一 个 或 多 个 输入 变量 的 数据 时 . 则 需要 从 知识 库存 储 的 对 应 数据 
中 选取 预定 数量 的 数据 对 缺少 数据 的 输入 变量 进行 赋值 。 预 定数 量 可 以 是 用 户 通 过 输入 设 
备 输入 的 , 当 用 户 未 输入 时 ,预定 数量 可 以 根据 预 设 比例 计算 。 具 体 而 言 , 先 根据 缺少 数据 
的 输入 变量 从 知识 库 中 查找 缺少 数据 输入 数据 数量 ,例如 缺少 数据 的 输入 变量 为 体重 ,那么 
就 从 知识 库 中 查找 体重 这 一 项 的 数据 , 当 体重 这 一 项 的 数据 有 120 项 时 ,那么 知识 库 中 缺少 
数据 的 输入 变量 为 体重 的 对 应 数据 数量 则 为 120。 再 获取 到 预 设 比例 为 2/3, 那 么 预定 数量 
则 等 于 120 乘 以 2/3, 即 预定 数量 为 80。 当 计算 出 来 的 预定 数量 不 是 整数 时 , 则 可 以 通过 四 
舍 五 人 或 取 整 的 方式 取 整 数值 。 预 设 比例 的 设 定 可 由 研究 人 员 根 据 研究 需求 而 定 。 预 设 比 
例 的 设 定 较 灵活 ,可 根据 实际 项 目 需求 进行 调整 .根据 预 设 比例 与 总 体 数据 数量 进行 预 设 数 
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量 的 确定 ,也 能 保证 选取 数据 的 数量 ,提高 输出 数据 的 总 体 准 确 性 。 

在 一 个 技术 方案 中 ,在 将 多 组 完整 输入 数据 输入 到 预先 训练 好 的 深度 学 习 模型 中 ,计算 
得 到 多 组 输出 数据 之 后 ,统计 多 组 输出 数据 中 各 类 输出 数据 所 占 的 比例 ; 将 比例 最 高 的 一 
类 输出 数据 作为 预测 结果 ; 将 预测 结果 及 各 类 输出 数据 及 其 相应 比例 输出 给 用 户 。 

在 得 到 多 个 输出 数据 之 后 ,需要 分 别 统计 各 类 输出 数据 所 占 的 比例 ,再 将 比例 最 高 的 输 
出 数据 作为 预测 结果 。 

例如 ,输入 变量 为 体重 ,身高 .血压 ,血液 检查 结果 ,输出 变量 为 糖尿 病 严重 程度 等 , 当 输 
人 多 组 体重 ,身高 .血压 ,血液 检查 结果 的 数据 后 ,能 获得 多 组 输出 的 关于 糖尿 病 严 重 程度 的 
数据 。 当 输出 的 糖尿 病 严 重 程度 数据 为 "0 的 有 10 个 ,为 “1? 的 有 30 个 ,为 “2 的 有 15 个 
时 , 则 将 占 比例 最 高 的 为 "1 的 数据 作为 预测 结果 。 其 中 ,数据 为 "0 代表 没 有 糖尿 病 ,数据 
为 “1 代表 有 轻微 糖尿 病 ,数据 为 2? 代表 有 严重 糖尿 病 。 具 体 的 数据 输出 可 巾 研究 人 员 进 
行 自 定义 设置 。 

例如 ,根据 Yi 、Y,、…、Yiw 的 值 进行 统计 ,其 中 输出 为 0 的 有 10 个 ,为 “1” 的 有 30 个 ,为 
“2” 的 有 60 个 。 其 中 *0” 代 表 没 有 糖尿 病 ,“1” 代 表 有 轻微 糖尿 病 ,“2” 代 表 有 严重 糖尿 病 , 则 
输出 为 “0”( 代 表 没 有 糖尿 病 ) 的 比例 是 10% ,输出 为 *1”( 代 表 轻 微 糖尿 病 ) 的 比例 是 30%， 
输出 为 *2”( 代 表 严 重 糖尿 病 ) 的 比例 是 60%。 

将 多 个 输出 数据 及 其 对 应 比例 输出 给 用 户 ,作为 不 完整 输入 数据 的 输出 数据 ; 将 最 高 
比例 对 应 的 输出 数据 输出 给 用 户 ,作为 不 完整 输入 数据 的 最 大 概率 输出 数据 。 

例如 ,将 输出 为 “0”( 代 表 没 有 糖尿 病 ) 的 比例 是 10% ,输出 为 "1”( 代 表 轻 微 糖尿 病 ) 的 
比例 是 30% ,输出 为 *2”( 代 表 严 重 糖尿 病 ) 的 比例 是 60% 输 出 给 用 户 ,作为 不 完整 输入 数据 
血压 C、 血 液 检查 结果 D、 尿 液 检查 结果 下 的 输出 。 

在 医疗 行业 ,虽然 有 诊疗 神经 网 络 模型 ,但 输入 变量 很 多 ,例如 糖尿 病 神经 网 络 模型 , 输 
出 是 无 糖尿 病 、X 类 糖尿 病 、Y 类 糖尿 病 等 (实际 中 X、Y 有 具体 名 称 ) ,输入 为 血压 身高、 体 
重 、 血 液 检查 结果 (实际 中 包括 多 项 具体 指标 ) 、 尿 液 检查 结果 (实际 中 包括 多 项 具体 指标 )。 
但 患者 刚 开始 来 的 时 候 , 可 能 其 中 血液 没有 检查 ,那么 在 现 有 技术 中 就 无 法 使 用 该 模型 了 ， 
而 采用 本 技术 方案 可 以 通过 已 有 的 患者 输入 数据 ,大 概 地 判别 各 种 疾病 的 可 能 性 ,进行 预 诊 
和 分 诊 ,假如 通过 现 有 残缺 的 数据 就 足以 判断 出 想 要 的 结果 ,例如 , 现 有 数据 输入 后 ,发 现 输 
出 的 结果 只 有 无 糖尿 病 这 一 类 ,那么 就 无 须 再 多 做 检查 ,反而 节省 了 输入 数据 检测 和 采集 的 
成 本 ; 或 者 看 到 输出 为 *2”( 代 表 严 重 糖尿 病 ) 的 比例 是 60% ,说明 患 严重 糖尿 病 的 可 能 性 最 
大 , 则 需要 进一步 做 更 深入 的 检查 。 

当 输 出 数据 有 多 个 时 , 则 需要 对 输出 结果 进行 筛选 ,将 比例 较 高 的 数据 作为 预测 输出 数 
据 , 更 能 确保 预测 数据 的 准确 性 。 

在 一 个 技术 方案 中 ,将 对 缺少 数据 的 输入 变量 进行 赋值 获得 的 数据 ,与 从 待 预测 数据 中 
获取 的 输入 数据 进行 组 合 ,生成 多 组 完整 输入 数据 ,包括 : 从 样本 数据 库 中 随机 选取 预定 数 
量 的 训练 输入 数据 ,然后 提取 这 些 训 练 输入 数据 中 该 输入 变量 对 应 的 数据 对 缺少 数据 输入 
变量 进行 预定 数量 次 赋值 ; 其 中 ,预定 数量 由 用 户 输入 或 将 小 于 等 于 样本 数据 库 中 输入 数 
据 的 数量 的 P% 作 为 预定 数量 ,P 小 于 等 于 100, 样 本 数据 库 中 的 输入 数据 都 是 完整 的 输入 
数据 。 

在 一 个 技术 方案 中 ,在 从 待 预测 数据 中 获取 输入 变量 之 前 ,对 深度 学 习 模 型 进行 初始 
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化 ; 获取 训练 数据 ; 通过 训练 数据 对 初始 化 后 的 深度 学 习 模型 进行 训练 得 到 预先 训练 好 的 
深度 学 习 模 型 。 

深度 学 习 模 型 在 根据 输入 数据 预测 输出 数据 之 前 ,需要 先 获 取 深 度 学 习 模 型 并 对 其 进 
行 初始 化 ,再 获取 训练 数据 ,通过 训练 数据 对 初始 化 后 的 深度 学 习 模 型 进行 训练 ,训练 后 则 
能 获得 训练 好 的 深度 学 习 模 型 ,训练 好 的 深度 学 习 模 型 才能 用 于 对 输出 数据 的 预测 操作 。 
深度 学 习 模 型 可 以 自行 创建 ,也 可 以 为 了 节约 创建 时 间 ,直接 从 深度 学 习 模型 库 中 获取 匹配 
度 较 高 的 深度 学 习 模型 ,再 对 获取 到 的 深度 学 习 模 型 进行 初始 化 ,初始 化 后 的 深度 学 习 模 型 
才能 与 当前 研究 项 目 需要 的 输入 变量 与 输出 变量 更 契合 ,而 对 深度 学 习 模 型 训练 后 才能 使 
得 深度 学 习 模 型 更 准确 地 预测 输出 数据 。 

在 一 个 技术 方案 中 ,对 深度 学 习 模型 进行 初始 化 ,包括 : 根据 样本 数据 库 中 训练 数据 的 
字段 名 确定 样本 输入 变量 与 样本 输出 变量 ; 从 深度 学 习 模 型 库 中 选取 输入 变量 和 输出 变量 
与 样本 输入 变量 和 样本 输出 变量 匹配 的 深度 学 习 模 型 ; 对 选取 的 深度 学 习 模型 进行 初 
始 化 。 

在 知识 库 中 存储 有 多 种 类 型 的 数据 ,每 个 类 型 的 数据 有 对 应 的 字段 。 例 如 ,存储 的 数据 
中 包括 有 体重 .身高 .血压 这 三 种 类 型 的 数据 ,那么 对 应 的 字段 可 设 为 体重 .身高 .血压 。 再 
根据 研究 项 目 需求 ,从 知识 库 中 选择 需要 用 到 的 字段 ,将 选取 的 字段 确认 为 样本 输入 变量 与 
样本 输出 变量 。 例 如 , 当 项 目 需 要 研究 根据 身高 ,体重 .血压 .血液 检测 结果 等 数据 预测 该 用 
户 是 否 患 有 糖尿 病 和 患 病 严重 程度 时 ,可 从 知识 库 中 选择 体重 .血压 .血液 检测 结果 的 字段 
作为 样本 输入 变量 ,并 选择 糖尿 病 类 型 作为 样本 输出 变量 , 则 项 目 研究 需要 的 深度 学 习 模 型 
的 输入 变量 为 体重 .血压 .血液 检测 结果 ,而 输出 变量 则 为 糖尿 病 类 型 。 

当 确定 了 样本 输入 变量 与 样本 输出 变量 后 ,可 根据 样本 输入 变量 与 样本 输出 变量 从 深 
度 学 习 模 型 库 中 选取 相 匹 配 的 深度 学 习 模型 。 由 于 深度 学 习 模 型 库 中 的 神经 网 络 模型 数量 
较 多 ,在 选取 与 实际 需求 对 应 的 神经 网 络 模型 时 ,应 该 先 根据 研究 需求 从 知识 库 中 选择 对 应 
的 字段 将 项 目 需要 的 神经 网 络 模型 的 输入 变量 与 输出 变量 设 定 , 然 后 再 根据 设 定 的 输入 变 
量 与 输出 变量 从 深度 学 习 模 型 库 中 查找 与 实际 项 目 需求 相 匹配 的 神经 网 络 模 型 。 这 样 能 减 
少 选择 神经 网 络 模型 的 操作 步骤 ,节约 时 间 成 本 。 

在 一 个 技术 方案 中 ,从 深度 学 习 模 型 库 中 选取 输入 变量 和 输出 变量 与 样本 输入 变量 和 
样本 输出 变量 匹配 的 深度 学 习 模型 ,采用 如 下 公式 计算 深度 学 习 模 型 库 中 输入 变量 和 输出 
变量 分 别 与 样本 输入 变量 和 样本 输出 变量 之 间 的 匹配 度 : 

匹配 度 二 深度 学 习 模 型 库 中 输入 变量 与 样本 输入 变量 的 匹配 度 Xu% 十 
深度 学 习 模 型 库 中 输出 变量 与 样本 输出 变量 的 匹配 度 X (1 一 u%) 
其 中 ,x 为 预 设 权重 。 从 匹配 度 中 选取 匹配 度 最 大 的 深度 学 习 模 型 返回 给 用 户 ; 将 用 户 确 
认 或 修改 后 的 深度 学 习 模 型 作为 预 置 深度 学 习 模 型 。 

当 根 据 样 本 输入 变量 和 样本 输出 变量 从 深度 学 习 模型 库 中 选择 匹配 的 深度 学 习 模型 
时 ,可 将 深度 学 习 模 型 库 中 的 多 个 深度 学 习 模型 的 输入 变量 和 输出 变量 分 别 与 样本 输入 变 
量 和 样本 输出 变量 进行 对 比 匹配 ,再 将 两 者 的 匹配 度 综合 ,选择 综合 匹配 度 最 高 的 。 具 体 而 
言 , 可 以 设置 一 个 预定 权重 ,例如 设 定 权 重 为 50 时 , 则 说 明 研 究 人 员 认 为 输入 变量 与 输出 变 
量 的 重要 性 是 一 致 的 。 将 深度 学 习 模 型 库 中 的 多 个 深度 学 习 模型 的 输入 变量 与 样本 输入 变 
量 一 一 对 比 ,获取 输入 变量 与 样本 输入 变量 的 匹配 度 。 再 将 深度 学 习 模 型 库 中 的 多 个 深度 
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学 习 模型 的 输出 变量 与 样本 输出 变量 一 一 对 比 , 获 取 输 出 变量 与 样本 输出 变量 的 匹配 度 。 

例如 ,神经 网 络 A 的 输入 变量 与 样本 输入 变量 的 匹配 度 为 4/5, 神 经 网 络 A 的 输出 变量 与 
样本 输出 变量 的 匹配 度 为 3/4, 那 么 神经 网 络 A 的 综合 匹配 度 为 4/5X50% 十 3/4X (1 一 
50%) 二 0.775。 当 将 深度 学 习 模型 库 中 的 多 个 深度 学 习 模 型 都 一 一 匹配 完毕 后 ,统计 每 个 
深度 学 习 模 型 与 样本 输入 变量 和 样本 输出 变量 的 综合 匹配 度 , 并 将 匹配 度 最 高 的 神经 网 络 
作为 预 置 深 度 学 习 模 型 。 因 此 ,车 是 其 他 神经 网 络 的 综合 匹配 度 低 于 0.775 时 , 则 选择 匹配 
度 最 高 的 神经 网 络 A 作为 预 置 深度 学 习 模 型 。 

将 样本 输入 变量 与 样本 输出 变量 均 作为 挑选 标准 ,能 在 更 大 程度 上 保证 “挑选 ”出 的 深 
度 学 习 模型 与 实际 项 目 需 求 的 契合 度 , 更 能 节约 研究 的 时 间 成 本 。 

在 一 个 技术 方案 中 ,对 初始 化 后 的 深度 学 习 模 型 进行 训练 得 到 预先 训练 好 的 深度 学 
习 模 型 ,包括 : 获取 初始 化 后 的 深度 学 习 模 型 中 的 输入 变量 与 输出 变量 ; 从 知识 库 中 获 
取 输 入 数据 ,将 其 输入 到 深度 学 习 模 型 中 进行 无 监督 训练 ; 从 知识 库 中 获取 输入 数据 及 
输出 数据 ,将 输入 数据 作为 初始 化 后 的 深度 学 习 模 型 的 输入 ,将 输出 数据 作为 初始 化 后 
的 深度 学 习 模 型 的 预期 输出 ,对 初始 化 后 的 深度 学 习 模 型 进行 有 监督 训练 。 将 每 个 训练 
输入 数据 作为 深度 学 习 模 型 的 输入 ,对 深度 学 习 模 型 进行 无 监督 训练 ; 将 每 个 带 标签 的 
训练 输入 数据 及 其 对 应 的 预期 标签 作为 深度 学 习 模 型 的 输入 和 预期 输出 ,对 深度 学 习 模 
型 进行 有 监督 训练 。 

当 从 深度 学 习 模 型 库 中 选择 了 某 一 个 深度 学 习 模 型 后 ,会 先 对 该 深度 学 习 模 型 进行 初 
始 化 ,得 到 初始 化 后 的 深度 学 习 模 型 ,初始 化 后 的 深度 学 习 模 型 对 应 有 输入 变量 与 输出 变 
量 。 然 后 对 初始 化 后 的 深度 学 习 模 型 进行 训练 ,训练 分 为 无 监督 训练 和 有 监督 训练 。 一 般 
情况 下 ,先进 行 无 监督 训练 ,再 进行 有 监督 训练 。 无 监督 训练 是 指 从 知识 库 中 获取 输入 数 
据 , 将 输入 数据 输入 到 初始 化 后 的 深度 学 习 模 型 中 进行 无 监督 训练 。 无 监督 训练 不 需要 预 
期 输出 ,而 有 监督 训练 则 需要 预期 输出 。 

例如 , 当 输 入 变量 为 体重 、 身 高 .血压 、 血 液 检测 结果 、 尿 液 检 测 结果 时 ,从 知识 库 中 获取 
多 组 体重 .身高 .血压 .血液 检测 结果 、 尿 液 检测 结果 字段 对 应 的 数据 作为 输入 变量 对 应 的 数 
据 , 可 以 对 初始 化 后 的 深度 学 习 模型 进行 无 监督 训练 。 

在 无 监督 训练 后 ,再 对 深度 学 习 模 型 进行 有 监督 训练 。 进 行 有 监督 训练 时 ,会 将 深度 学 
习 模 型 的 输入 数据 与 预期 输出 均 提供 。 例 如 , 当 体 重 、 身 高 血压、 血液 检测 结果 、 尿 液 检测 
结果 为 输入 变量 ,糖尿病 类 型 为 输出 变量 时 ,从 知识 库 中 获取 体重 .身高 .血压 .血液 检测 结 
果 、 尿 液 检测 结果 字段 对 应 的 多 组 数据 作为 输入 变量 对 应 的 数据 ,将 糖尿 病 类 型 字段 对 应 的 
数据 作为 输出 变量 对 应 的 数据 ,对 始 化 后 的 深度 学 习 模 型 进行 有 监督 训练 。 

用 户 样本 数据 中 存储 有 多 组 用 户 数据 。 例 如 ,每 组 用 户 数据 中 的 数据 类 型 包括 有 每 个 
用 户 的 体重 .身高 .血压 .血液 检测 结果 、 尿 液 检测 结果 以 及 糖尿 病 类 型 数据 。 但 是 ,并 不 是 
每 组 用 户 数据 都 是 完整 的 ,可 能 存在 有 的 用 户 数据 中 缺少 糖尿 病 类 型 数据 ,这 部 分 缺少 糖尿 
病 类 型 数据 的 用 户 数据 可 以 用 于 对 深度 学 习 模 型 进行 无 监督 训练 ,避免 了 数据 的 浪费 。 由 
于 无 监督 训练 先 训练 了 深度 学 习 模 型 的 特征 提取 能 力 ,在 进行 了 无 监督 训练 后 再 进行 有 监 
督 训练 也 能 提升 深度 学 习 模 型 的 训练 效果 ,提升 训练 后 的 深度 学 习 模 型 预测 输出 数据 的 准 
确 度 。 
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3.2.2 残缺 深度 学 习 模型 系统 


图 3-4 提供 了 一 种 深度 学 习 模型 装置 ,包括 ; [AT | 
(1) 数据 获取 模块 1, 用 于 获取 预先 训练 好 的 深度 学 习 

模型 ,从 待 预 测 数据 中 获取 输入 数据 。 ST Tees 
(2) 缺少 数据 的 输入 变量 确认 模块 2, 用 于 根据 输入 数 量 确 认 模块 2 

据 和 预先 训练 好 的 深度 学 习 模 型 的 输入 变量 确定 至 少 一 个 

缺少 数据 的 输入 变量 。 取 值 范围 
(3) 取 值 范围 获取 模块 3, 用 于 将 对 缺少 数据 的 输入 变 获取 模块 3 

量 进 行 赋值 获得 的 数据 ,与 从 待 预 测 数据 中 获取 的 输入 数据 | 

进行 组 合 , 生 成 多 组 完整 输入 数据 。 数据 输入 模块 4 


在 一 个 技术 方案 中 , 取 值 范围 获取 模块 3 还 用 于 从 输入 图 3 4 深度 学 习 模 型 方法 的 
变量 范围 知识 库 中 检索 出 缺少 数据 输入 变量 对 应 的 预 设 取 装置 结构 框图 

值 范围 ,其 中 ,输入 变量 范围 知识 库 预 先 存 有 所 有 输入 变量 

对 应 的 预 设 取 值 范围 ; 或 从 所 有 训练 输入 数据 中 获取 缺少 数据 输入 变量 的 值 ,统计 获取 到 
的 缺少 数据 输入 变量 的 最 大 值 和 最 小 值 ,将 从 最 小 值 到 最 大 值 之 问 值 的 范围 作为 缺少 数据 
输入 变量 的 预 设 取 值 范围 ; 或 提示 并 接受 用 户 输 入 缺少 数据 输入 变量 的 预 设 取 值 范围 

在 对 应 的 预 设 取 值 范围 内 随机 生成 预定 数量 个 值 对 缺少 数据 的 输入 变量 进行 预定 数量 
次 赋值 ; 其 中 ,预定 数量 由 用 户 输入 或 预先 设置 。 

在 一 个 技术 方案 中 , 取 值 范围 获取 模块 3 还 用 于 从 样本 数据 库 中 随机 选取 预定 数量 个 
训练 输入 数据 ,然后 提取 其 中 该 输入 变量 对 应 的 数据 对 缺少 数据 输入 变量 进行 预定 数量 次 
赋值 ; 其 中 ,预定 数量 由 用 户 输入 或 将 小 于 等 于 样本 数据 库 中 输入 数据 的 数量 的 P% 作 为 
预定 数量 ,P 小 于 等 于 100, 样 本 数据 库 中 的 输入 数据 都 是 完整 的 输入 数据 。 

(4) 数据 输入 模块 4, 用 于 将 多 组 完整 输入 数据 输入 到 预先 训练 好 的 深度 学 习 模 型 中 ， 
计算 得 到 多 组 输出 数据 。 

在 一 个 技术 方案 中 ,数据 输入 模块 4 还 用 于 统计 多 组 输出 数据 中 各 类 输出 数据 所 占 的 
比例 ; 将 比例 最 高 的 一 类 输出 数据 作为 预测 结果 ; 将 预测 结果 及 各 类 输出 数据 及 其 相应 比 
例 输出 给 用 户 。 

(5) 在 一 个 技术 方案 中 ,上 述 深度 学 习 模型 装置 还 包括 训练 模块 5, 用 于 对 深度 学 习 模 
型 进行 初始 化 ,获取 训练 数据 ,通过 训练 数据 对 初始 化 后 的 深度 学 习 模型 进行 训练 得 到 预先 
训练 好 的 深度 学 习 模 型 。 


深度 学 习 模 型 的 预报 预测 大 数据 应 用 


深度 学 习 模 型 的 应 用 很 多 ,其 中 深度 学 习 模 型 的 预报 预测 大 数据 应 用 有 着 非常 重要 的 
应 用 价值 和 前 景 。 fie las 习 模型 的 预报 预测 大 数据 应 用 : 基于 大 数据 深度 
学 习 和 分 析 场 的 气象 预报 、 分 析 预 测 文化 冲突 的 深度 学 习 。 基 于 大 数据 深度 学 习 和 分 析 场 
的 气象 预报 方法 包括 : 获取 预报 区 域 最 近 设 定时 长 内 的 气象 分 析 场 序列 ; 将 最 近 气 象 分 析 
场 序列 输入 预报 区 域 的 深度 神经 网 络 进行 深度 学 习 , 得 到 预报 区 域 的 深度 神经 网 络 的 输出 ; 
将 输出 作为 预报 区 域 自 当前 时 刻 开 始 的 预报 时 长 内 的 预报 场 序列 。 该 系统 包括 : 分 析 场 获 
取 模 块 ,用 于 获取 预报 区 域 最 近 设 定时 长 内 的 气象 分 析 场 序列 ; 预报 模块 ,用 于 将 最 近 气 象 
分 析 场 序列 输入 预报 区 域 的 深度 神经 网 络 进行 深度 学 习 , 得 到 预报 区 域 的 深度 神经 网 络 的 
输出 ; 将 输出 作为 预报 区 域 自 当 前 时 刻 开始 的 预报 时 长 内 的 预报 场 序列 。 利 用 上 述 方法 和 
系统 ,气象 预报 更 加 准确 。 分 析 预 测 文化 冲突 的 深度 学 习 方法 包括 : 获取 待 预测 用 户 的 文 
化 差异 值 ,文化 差异 值 反 映 了 待 预测 用 户 迁 入 地 和 迁 出 地 之 间 的 文化 差异 ; 获取 待 预测 用 
户 的 文化 素养 值 . 同 类 群体 大 小 值 以 及 过 渡 时 长 值 ; 将 文化 差异 值 文 化 素养 值 \. 同 类 群体 
大 小 值 以 及 过 渡 时 长 值 输入 到 预先 训练 好 的 深度 学 习 模 型 中 ,输出 待 预测 用 户 的 文化 冲突 
事件 类 型 数据 。 通 过 对 深度 学 习 模 型 的 运用 .能 够 在 获取 到 个 人 的 某 些 特定 数据 的 情况 下 ， 
对 个 人 进行 移民 时 可 能 发 生 的 文化 冲突 事件 类 型 进行 预测 ,进而 为 预防 和 消解 文化 冲突 提 
供 决 策 辅助 。 


4.1 基于 大 数据 深度 学 习 和 分 析 场 的 气象 预报 


天 气 变化 与 人 们 的 生产 活动 ,社会 活动 .军事 活动 以 及 日 常生 活 都 有 着 十 分 密切 的 关 
系 。 一 直 以 来 ,人 们 总 是 想方设法 去 预测 未 来 的 天 气 变化 ,以 利用 有 利 的 天 气 , 同 时 提前 预 
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防 不 利 天 气 带 来 的 气象 灾害 。 

传统 技术 中 ,人 们 预测 天 气 采 用 数值 预测 的 方法 ,数值 预测 的 原理 为 : 通过 天 气 图 或 者 
卫星 云图 获取 气象 图 像 , 并 在 一 定 的 初 值 和 边 值 条 件 下 ,利用 大 型 计算 机 做 数值 计算 ,求解 
描述 天 气 演 变 过 程 的 流体 力学 和 热力 学 的 方程 组 ,预测 未 来 一 定时 段 的 大 气 运动 状态 和 天 
气 现象 的 方法 。 上 述 的 数值 预测 方法 是 基于 数学 模型 进行 模式 推导 的 ,误差 较 大 5529 。 

本 技术 研究 并 给 出 了 一 种 新 的 气象 预报 方法 和 系统 。 具 体 方法 包括 : 获取 预报 区 域 的 
最 近 设 定时 长 内 的 气象 分 析 场 序列 ; 将 最 近 气 象 分 析 场 序列 输入 预报 区 域 的 深度 神经 网 络 
进行 深度 学 习 , 得 到 预报 区 域 的 深度 神经 网 络 的 输出 ; 将 输出 作为 预报 区 域 的 自 当前 时 刻 
开始 的 预报 时 长 内 的 预报 场 序 列 。 有 具体 系统 包括 : 分 析 场 获取 模块 ,用 于 获取 预报 区 域 的 
最 近 设 定时 长 内 的 气象 分 析 场 序列 ; 预报 模块 ,用 于 将 最 近 气象 分 析 场 序列 输入 预报 区 域 
的 深度 神经 网 络 进行 深度 学 习 , 得 到 预报 区 域 的 深度 神经 网 络 的 输出 ; 将 输出 作为 预报 区 
域 的 自 当 前 时 刻 开 始 的 预报 时 长 内 的 预报 场 序 列 。 利 用 上 述 方法 和 系统 ,气象 预报 更 加 
准确 。 


4.1.1 基于 大 数据 深度 学 习 和 分 析 场 的 气象 预报 方法 


1. 基于 大 数据 深度 学 习 和 分 析 场 的 气象 预报 的 基本 方法 
如 图 4-1 所 示 为 本 技术 方案 的 气象 预报 方法 流程 图 。 该 方法 包括 : 
开始 


1 
| SRS 1; 获取 预报 区 域 的 最 近 设 定时 


长 内 的 气象 分 析 场 序列 


ane Pleas i 


: 长 内 的 气象 分 析 场 序 
深度 学 


步骤 S3 : 将 所 述 输出 作为 预报 区 域 的 自 当前 
时 刻 开始 的 预报 时 长 内 的 预报 场 序 列 


结束 
图 4-1 气象 预报 方法 流程 图 


(1) 步骤 S1, 获 取 预 报 区 域 的 最 近 设 定时 长 内 的 气象 分 析 场 序列 。 预 报 区 域 指 准 备 作 
出 气象 预报 的 区 域 ,范围 可 根据 需求 确定 ,例如 中 国 可 按照 省 、 市 等 行政 区 域 进行 划分 。 最 
近 设 定时 长 内 是 指 以 当前 时 间 为 分 界 点 ,在 当前 时 间 之 前 的 最 近 的 一 个 设 定时 长 的 时 间 段 
内 。 气 象 分 析 场 指 的 是 用 实况 资料 作为 分 析 数 据 , 是 真实 的 、 确 定 的 。 气 象 分 析 场 在 气象 预 
报 领 域 的 含义 是 所 属 领域 的 技术 人 员 所 熟知 的 。 

气象 分 析 场 序列 由 多 个 时 间 点 的 气象 分 析 场 有 序 组 成 。 例 如 , 设 定时 长 是 60min, 且 假 
定 气象 分 析 场 的 时 间 分 辩 率 是 1min, 那 么 60min 内 会 有 60 个 气象 分 析 场 ,这 60 个 气象 分 


P02 数据 处 理 与 深度 学 习 | 


析 场 按照 时 间 先 后 顺序 排列 就 组 成 了 一 个 时 长 为 60min 的 气象 分 析 场 序列 。 预 报 区 域 例 
如 深圳 市 ,预报 时 长 例如 12h. 即 从 当前 时 刻 开始 的 将 来 12h。 

参考 图 4-2 ,假设 当前 时 刻 是 4 月 11 日 12 点 0 分 ,预报 区 域 的 最 近 设 定时 长 内 气象 分 
析 场 序列 就 是 4 月 11 日 11 点 0 分 至 4 月 11 日 12 点 0 分 的 气象 分 析 场 序列 。 


当前 时 刻 


1111:00 气 旬 分 析 4 12:00 1200:00 
场 序列 | 预报 场 序列 | 
设 定时 长 预报 时 长 
例如 60min 例如 12h 


图 4-2 各 时 间 点 和 时 间 段 在 时 间 轴 上 的 相对 位 置 示意 图 


(2) 步骤 S2 ,将 最 近 设 定时 长 内 的 气象 分 析 场 序列 输入 预报 区 域 的 深度 神经 网 络 进行 
深度 学 习 , 得 到 预报 区 域 的 深度 神经 网 络 的 输出 。 深 度 神经 网 络 特 指 预报 区 域 的 深度 神经 
网 络 ,其 以 该 预报 区 域 的 气象 分 析 场 序列 为 输入 ,根据 输入 得 到 深度 神经 网 络 的 输出 。 

(3) 步骤 S3 ,将 输出 作为 预报 区 域 的 自 当前 时 刻 开 始 的 预报 时 长 内 (例如 ,预报 时 长 为 
12h 时 , 则 为 4 月 11 日 12 点 0 分 一 4 月 12 日 0 点 0 分 ) 的 预报 场 序列 。 

采用 深度 学 习 和 深度 神经 网 络 对 气象 进行 预测 ,由 于 深度 学 习 和 深度 神经 网 络 的 预测 
精度 非常 高 (这 已 经 在 很 多 应 用 中 得 到 了 印证 ,例如 图 像 识 别 , 而 气象 分 析 场 序列 与 图 像 数 
据 没 有 本 质 上 的 区 别 。 例 如 将 分 析 场 中 每 个 点 作为 一 个 像素 点 ,用 该 像素 点 的 RGB 表示 分 
析 场 中 该 点 的 属性 值 , 则 每 个 分 析 场 都 可 以 用 一 个 图 像 来 表示 。 而 气象 分 析 场 序列 是 由 多 
个 分 析 场 有 序 组 成 ,等 同 于 多 个 图 像 有 序 组 成 一 个 更 大 的 图 像 ) ,所 以 可 以 高 精度 地 预测 气 
象 ,这 种 预报 结果 可 以 与 模式 预报 的 结果 一 起 作为 预报 的 参考 依据 ,使 得 预报 员 能 做 出 更 为 
准确 的 天 气 预报 。 

2. 基于 大 数据 深度 学 习 和 分 析 场 的 气象 预报 的 详细 方法 

如 图 4-3 所 示 , 步 骤 Sl 包括 : 

(1) 步骤 S1-1, 获 取 预 报 区 域 。 预 报 区 域 可 以 由 用 户 指定 。 确 定 预报 区 域 的 意义 还 在 
于 选择 对 应 的 深度 神经 网 络 和 输入 相应 的 气象 分 析 场 序列 。 

(2) 步骤 S1-2 ,确定 预报 时 长 。 预 报时 长 可 以 由 用 户 指定 。 预 报时 长 可 以 包括 未 来 
12h、24h、48h 以 及 72h 等 。 

(3) 步骤 S1-3 ,判断 气象 分 析 场 是 否 存在 , 若 气象 分 析 场 存在 , 则 执行 步骤 S1-4; 否则 
执行 步骤 S1-5。 

(4) 步骤 S1-4, 直 接 获取 气象 分 析 场 。 

(5) 步骤 S1-5, 将 气象 分 析 场 所 在 时 刻 的 在 分 析 场 作为 分 析 场 。 在 气象 分 析 场 是 用 实 
况 资料 进行 插值 反 演 等 ,因为 实况 资料 的 站 点 分 布 不 均匀 ,在 气象 分 析 场 是 经 过 插值 后 均匀 
分 布 的。 气象 分 析 场 在 气象 预报 领域 的 含义 也 是 所 属 领 域 的 技术 人 员 所 熟知 的 。 

如 图 4-4 所 示 , 对 预报 区 域 的 深度 神经 网 络 进行 训练 。 深 度 神 经 网 络 的 特点 是 : 经 过 
大 量 有 效 的 数据 的 训练 后 ,其 预测 的 准确 性 会 更 高 。 在 执行 上 述 步 又 S2 之 前 ,需要 保证 预 
报 区 域 的 深度 神经 网 络 具 有 相当 程度 的 预测 准确 率 , 和 否则 应 该 首先 执行 大 量 的 训练 过 程 ,再 
将 深度 神经 网 络 用 于 气象 预报 。 
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步 ， 六 合 入 层 、 预 设 导数 个 中 
EBS 1-1. FE 步骤 S1-1: 初始 化 一 个 具有 输入 层 、 预 设 层 数 个 中 间 
it res 层 以 及 输出 层 的 深度 神经 网 络 


步骤 S1-2'; 获取 预报 区 域 当前 时 刻 预 报时 长 之 前 
的 第 一 气象 分 析 场 序列 和 紧 随 其 后 的 第 二 
气象 分 析 场 序列 


il 


1 
步骤 S1-2 : 确定 预报 时 长 


步骤 S1-3': 将 所 述 第 一 和 第 二 气象 分 析 场 序 
列 作为 深度 神经 网 络 的 输入 和 输出 ， 对 深 
度 神经 网 络 进行 训练 


GIRS 1-4: 直接 获取 所 述 气象 分 析 场 


| 步 又 S1-4: 将 训练 得 到 的 深度 神经 网 络 ， 作 为 所 述 


1 
步骤 S1-5 : 将 所 述 气象 分 析 场所 在 时 刻 的 在 


Dx aI VAC IEE REL 
分 析 场 作为 所 述 分 析 场 预报 区 域 的 深度 神经 网 络 
结束 结束 
图 4-3 步骤 Sl 的 具体 流程 图 图 4-4 训练 深度 神经 网 络 的 流程 图 
步骤 S1' 包 括 : 


子 步骤 S1-1': 初始 化 一 个 具有 输入 层 、 预 设 层 数 中 间 层 以 及 输出 层 的 深度 神经 网 络 。 
预 设 层 数 小 于 设 定时 长 内 气象 分 析 场 序列 中 气象 分 析 场 的 数量 。 

子 步 又 S1-2': 获取 预报 区 域 当前 时 刻 预 报时 长 之 前 的 第 一 气象 分 析 场 序列 和 紧 随 之 
后 的 第 二 气象 分 析 场 序列 。 其 中 ,第 一 气象 分 析 场 序列 为 任 一 符合 预 设 条 件 的 设 定时 长 内 
的 气象 分 析 场 序列 。 预 设 条 件 为 无 条 件 或 季节 条 件 。 季 节 条 件 是 指 , 当 前 预报 时 间 所 在 的 
季节 与 输入 的 气象 分 析 场 序列 数据 应 该 在 季节 上 一 致 ,例如 100 天 之 内 。 

参考 图 4-5, 例 如 当前 时 刻 是 4 月 11 日 12 点 0 分 ,预报 时 长 为 12h, 则 12h 之 前 是 4 月 
11 日 0 点 0 分 之 前 。 那么 在 这 个 例子 中 ,当时 时 刻 预报 时 长 之 前 ,就 是 4 月 11 日 0 点 0 分 
Zi. 在 4 月 11 日 0 点 0 分 之 前 , 取 任 一 设 定时 长 内 (例如 4 月 9 日 23 点 0 分 一 4 月 10 日 
0 点 0 分 ) 的 气象 分 析 场 序列 作为 第 一 气象 分 析 场 序列 ,其 之 后 的 预报 时 长 内 (例如 4 月 10 
日 0 点 0 分 一 4 月 10 日 12 点 0 分 ) 的 气象 分 析 场 序列 为 第 二 分 析 场 序列 。 


[入 随后 当前 时 刻 
全 4-11 00:00 aia 4-12 00:00 
are | 析 场 序列 | | 1 预报 场 | 
oa be et 
设 定时 长 预报 时 长 预报 时 长 预报 时 长 

例如 12h 例如 12h 例如 12h 


图 45 训练 过 程 的 各 时 间 点 和 时 间 段 在 时 间 轴 上 的 相对 位 置 示意 图 


子 步骤 S1-3 : 将 第 一 和 第 二 气象 分 析 场 序列 作为 深度 神经 网 络 的 输入 和 输出 ,对 深度 
神经 网 络 进行 训练 ; 获取 多 个 第 一 气象 分 析 场 序列 和 对 应 的 第 二 气象 分 析 场 序列 ,根据 上 
述 训 练 方法 对 深度 神经 网 络 进行 重复 训练 。 
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具体 而 言 ,在 将 第 一 气象 分 析 场 序列 输入 到 输入 层 、 第 二 气象 分 析 场 序列 输入 到 输出 层 
之 后 ,进行 以 下 操作 : 

首先 ,在 第 一 气象 分 析 场 序 列 中 选取 预 设 层 数 数量 的 气象 分 析 场 。 在 子 步骤 S1-1 中 ， 
初始 化 一 个 具有 预 设 层 数 中 间 层 的 深度 神经 网 络 。 本 步骤 中 ,从 第 一 气象 分 析 场 序列 中 选 
取 该 预 设 层 数 数量 的 气象 分 析 场 ,获取 预 设 层 数 个 气象 分 析 场 对 应 的 时 间 点 ,将 时 间 点 中 离 
当前 时 刻 最 远 的 第 个 时 间 点 之 后 预报 时 长 内 的 气象 分 析 场 序列 输入 第 一 深度 神经 网 络 的 
Hk 个 中 间 层 ,其 中 ,k 是 从 1 到 预 设 层 数 的 自然 数 。 

为 控制 深度 神经 网 络 完成 训练 ,获取 当前 时 刻 (例如 4 月 11 日 12 点 0 分 ) 预 报时 长 之 
前 (例如 ,预报 时 长 为 12h,12h 之 前 是 4 月 11 日 0 点 0 分 之 前 ) 最 近 的 符合 预 设 条 件 的 设 定 
时 长 (例如 4 月 10 日 23 点 0 分 一 4 月 11 日 0 点 0 分 ) 内 的 第 三 气象 分 析 场 序列 及 紧 随 的 预 
报时 长 内 (例如 4 月 11 日 0 点 0 分 一 4 月 11 日 12 点 0 分 ) 的 第 四 气象 分 析 场 序列 。 

深度 神经 网 络 完成 训练 的 条 件 为 : 

将 第 三 气象 分 析 场 序列 输入 深度 神经 网 络 获得 输出 结果 与 对 应 的 第 四 气象 分 析 场 序列 
之 间 的 对 比 误差 不 大 于 停止 阔 值 。 深 度 神 经 网 络 在 进行 训练 的 同时 ,也 可 以 用 历史 数据 进 
行 预测 ,并 将 预测 的 结果 与 已 有 的 历史 数据 进行 比较 ,如 果 预 测 结果 与 历史 数据 非常 接近 ， 
则 说 明 深 度 神 经 网 络 训练 完成 ,可 以 将 其 用 于 预报 。 有 具体 而 言 , 用 于 训练 的 数据 存储 在 历史 
气象 大 数据 中 。 气 象 分 析 场 序列 均 是 由 服务 器 中 预存 的 气象 分 析 场 中 查找 获取 的 ,其 中 , 气 
象 分 析 场 是 通过 大 数据 进行 存储 和 获取 的 ,也 就 是 采集 任 一 时 间 任 一 预报 区 域 的 气象 分 析 
场 存 人 大 数据 ,从 大 数据 中 获取 任 一 时 间 任 一 预报 区 域 的 气象 分 析 场 。 

具体 而 言 ,建立 气象 分 析 场 的 HBASE 大 数据 库 表 , 并 将 采集 到 的 气象 分 析 场 及 其 对 应 
时 间 存 人 气象 分 析 场 的 HBASE 大 数据 库 表 ,同时 可 以 根据 气象 分 析 场 的 时 间 从 气象 分 析 
场 的 HBASE 大 数据 库 表 中 获取 对 应 时 间 的 气象 分 析 场 。 

子 步骤 S1-4 : 将 训练 得 到 的 深度 神经 网 络 ,作为 预报 区 域 的 深度 神经 网 络 。 


4.1.2 基于 大 数据 深度 学 习 和 分 析 场 的 气象 预报 系统 


如 图 4-6 所 示 的 为 一 技术 方案 的 气象 预报 系统 模块 图 ,该 气象 预报 系统 包括 分 析 场 获 


取 模 块 1、 预 报 模块 2 和 深度 神经 网 络 3。 
大 数据 5 
了 


分 析 场 获取 模块 1 训练 模块 4 | 


| | 
深度 神经 网 络 3 


预报 模块 2 
图 4-6 气象 预报 系统 模块 图 


(1) 分 析 场 获取 模块 1 用 于 获取 预报 区 域 最 近 设 定时 长 内 的 气象 分 析 场 序列 。 预 报 区 
域 指 准备 作出 气象 预报 的 区 域 .范围 可 根据 需求 确定 。 例 如 ,中 国 可 按照 省 市 等 行政 区 域 


El 
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进行 划分 。 最 近 设 定时 长 内 是 指 以 当前 时 间 为 分 界 点 ,在 当前 时 间 之 前 最 近 的 一 个 设 定时 
长 的 时 间 段 内 。 气 象 分 析 场 指 的 是 用 实况 资料 进行 的 分 析 数 据 , 是 真实 的 、 确 定 的 。 气 象 分 
析 场 在 气象 预报 领域 的 含义 是 所 属 领域 的 技术 人 员 所 熟知 的 。 

如 图 4-7 所 示 , 分 析 场 获取 模块 1 包括 预报 区 域 选 择 单 元 1-1、 预 报时 长 确定 单元 1-2 
以 及 分 析 场 生成 单元 1-3, 

预报 区 域 选 择 单元 1-1 用 于 获取 预报 区 域 。 确 定 预 报 区 域 的 意义 还 在 于 选择 对 应 的 深 
度 神 经 网 络 和 输入 相应 的 气象 分 析 场 序列 。 

预报 时 长 确定 单元 1-2 用 于 确定 预报 时 长 。 预 报时 长 可 以 由 用 户 指定 。 预 报时 长 可 以 
是 未 来 24h、48h 以 及 72h 等 。 

分 析 场 生成 单元 1-3 用 于 车 气象 分 析 场 存在 , 则 直接 获取 气象 分 析 场 ,否则 将 气象 分 析 
场所 在 时 刻 的 在 分 析 场 作为 分 析 场 。 在 分 析 场 是 用 实况 资料 进行 插值 反 演 等 ,因为 实况 资 
料 的 站 点 是 分 布 不 均匀 的 ,在 分 析 场 是 进 过 插值 后 是 均匀 分 布 的 。 在 分 析 场 在 气象 预报 领 
域 的 含义 也 是 所 属 领 域 的 技术 人 员 所 熟知 的 。 

(2) 预报 模块 2 用 于 将 最 近 气 象 分 析 场 序列 输入 预报 区 域 的 深度 神经 网 络 进行 深度 学 
习 , 得 到 预报 区 域 深度 神经 网 络 的 输出 。 深 度 神经 网 络 特 指 预报 区 域 的 深度 神经 网 络 , 其 以 
该 预报 区 域 的 气象 分 析 场 序列 为 输入 ,根据 输入 得 到 深度 神经 网 络 的 输出 。 

(3) 该 气象 预报 系统 还 可 以 包括 对 预报 区 域 的 深度 神经 网 络 3 进行 训练 的 训练 模块 4。 
如 图 4-8 所 示 ,训练 模块 4 包括 初始 化 单元 4-1 气象 分 析 场 获取 单元 4-2 和 训练 控制 单元 4-3。 
深度 神经 网 络 的 特点 是 ,经 过 大 量 有 效 的 数据 训练 后 ,其 预测 的 准确 性 会 更 高 。 在 进行 气象 
预报 前 ,需要 保证 预报 区 域 的 深度 神经 网 络 具 有 相当 程度 的 预测 准确 率 ,否则 应 该 首先 执行 
大 量 的 训练 过 程 ,再 将 深度 神经 网 络 用 于 气象 预报 。 


历史 气象 数据 库 


气象 分 析 场 


RATA? 初始 化 
| 单元 4-1 
训练 控制 厂 一 


单元 4-3 
分 析 场 生成 
sade 深度 神经 网 络 


图 4-7 分 析 场 获取 模块 的 模块 图 图 4-8 训练 模块 的 模块 图 


预报 区 域 选 预报 时 长 确 
择 单元 1-1 定单 元 1-2 


初始 化 单元 4-1 用 于 初始 化 一 个 具有 输入 层 、 预 设 层 数 个 中 间 层 以 及 输出 层 的 深度 神 
经 网 络 ; 预 设 层 数 小 于 设 定时 长 内 的 气象 分 析 场 序列 中 气象 分 析 场 的 数量 。 

气象 分 析 场 获取 单元 4-2 用 于 获取 预报 区 域 当 前 时 刻 预 报时 长 之 前 的 第 一 气象 分 析 场 
序列 和 紧 随 之 后 的 第 二 气象 分 析 场 序列 ,其 中 第 一 气象 分 析 场 序列 为 任 一 符合 预 设 条 件 的 
设 定 时 长 内 的 气象 分 析 场 序列 。 

训练 控制 单元 3 用 于 将 第 一 和 第 二 气象 分 析 场 序列 作为 深度 神经 网 络 的 输入 和 输 
出 ,对 深度 神经 网 络 进行 训练 ; 并 获取 多 个 第 一 气象 分 析 场 序列 和 对 应 的 第 二 气象 分 析 场 
序列 ,对 深度 神经 网 络 进行 重复 训练 ; 将 训练 完成 的 深度 神经 网 络 ,作为 预报 区 域 的 深度 神 
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经 网 络 。 

训练 控制 单元 还 获取 当前 时 刻 预报 时 长 之 前 最 近 的 符合 预 设 条 件 的 设 定时 长 内 的 第 三 
气象 分 析 场 序列 及 紧 随 之 后 的 第 四 气象 分 析 场 序列 。 深 度 神经 网 络 完 成 训练 的 条 件 为 : 第 
三 气象 分 析 场 序列 输入 深度 神经 网 络 所 得 的 输出 结果 与 对 应 的 第 四 气象 分 析 场 序列 之 间 的 
对 比 误差 不 大 于 停止 阔 值 。 

(4) 该 气象 预报 系统 还 可 以 包括 历史 气象 大 数据 5, 用 于 训练 的 数据 存储 在 历史 气象 大 
数据 5 中 。 采 用 大 数据 5, 可 以 利用 大 数据 进行 气象 预报 ,提高 预测 的 准确 性 。 

上 述 气象 预报 方法 和 系统 ,采用 深度 神经 网 络 对 最 近 的 预报 时 长 内 的 气象 分 析 场 序 
列 进行 深度 学 习 , 得 到 从 当前 时 间 开 始 的 预报 时 长 内 的 预报 场 。 由 于 深度 学 习 和 深度 神 
经 网 络 的 预测 精度 非常 高 (这 已 经 在 很 多 应 用 中 得 到 了 印证 ,例如 图 像 识别 ,而 气象 分 析 
场 序列 与 图 像 数 据 没有 本 质 上 的 区 别 。 例 如 将 气象 分 析 场 中 每 个 点 作为 一 个 像素 点 ,用 
该 像素 点 的 RGB 表示 气象 分 析 场 中 该 点 的 属性 值 , 则 每 个 气象 分 析 场 都 可 以 用 一 个 图 像 
来 表示 。 而 气象 分 析 场 序列 是 由 多 个 气象 分 析 场 有 序 组 成 的 ,等 同 于 多 个 图 像 有 序 组 成 
一 个 更 大 的 图 像 ), 所 以 可 以 高 精度 地 预测 气象 ,预测 结果 更 加 准确 。 这 种 预测 结果 可 以 
与 模式 预报 的 结果 一 起 作为 预报 员 预 报 的 参考 依据 ,使 得 预报 员 能 做 出 更 为 准确 的 天 气 
预报 。 


4.2 基于 深度 学 习 模 型 的 文化 冲突 分 析 预 测 


人 工 神经 网 络 (Artificial Neural Networks,ANN) 也 简称 为 神经 网 络 (NN) 或 连接 深度 
学 习 模型 (Connection Model) , 它 是 一 种 模仿 动物 神经 网 络 行为 特征 ,进行 分 布 式 并 行 信息 
处 理 的 算法 数学 深度 学 习 模 型 。 这 种 网 络 依靠 系统 的 复杂 程度 ,通过 调整 内 部 大 量 节 点 之 
间 相 互 连 接 的 关系 ,从 而 达到 信息 处 理 的 目的 。 人 工 神经 网 络 在 工程 与 学 术 界 也 常 直接 简 
称 为 “神经 网 络 ? 或 类 神经 网 络 , 可 以 用 于 分 析 预 测 。 

传统 技术 中 对 于 文化 认同 、 文 化 融合 以 及 文化 冲突 0"' 避 等 都 是 定性 分 析 , 没 有 定量 
分 析 , 没 有 形成 对 个 人 影响 的 判断 。 而 很 多 社会 问题 往往 都 是 文化 冲突 作用 于 个 人 所 形 
成 的 ,因此 无 法 分 析 文 化 冲突 对 个 人 的 影响 ,从 而 无 法 定量 地 起 到 辅助 决策 和 预防 冲突 
的 作用 。 

本 技术 研究 并 给 出 了 一 种 新 的 分 析 预 测 文化 冲突 的 深度 学 习 方 法 、 系 统 。 方 法 包括 : 
获取 待 预 测 用 户 的 文化 差异 值 ,文化 差异 值 反 映 了 待 预 测 用 户 迁 入 地 和 迁 出 地 之 间 的 文化 
差异 ; 获取 待 预 测 用 户 的 文化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 长 值 ; 将 文化 差异 值 、 文 
化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 长 值 输入 预先 训练 好 的 深度 学 习 模 型 中 ,输出 待 预测 
用 户 的 文化 冲突 事件 类 型 数据 。 通 过 对 深度 学 习 模型 的 运用 ,能 够 在 获取 个 人 某 些 特定 数 
据 的 情况 下 ,对 个 人 进行 移民 时 可 能 发 生 的 文化 冲突 事件 类 型 进行 预测 ,进而 为 预防 和 消解 
文化 冲突 提供 决策 辅助 。 
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4.2.1 基于 深度 学 习 模型 的 文化 冲突 分 析 预 测 方法 


1. 分 析 预 测 文 化 冲突 的 深度 学 习 模 型 的 基本 方法 
如 图 4-9 所 示 , 在 一 个 技术 方案 中 ,提供 了 一 种 分 | yggs1 ,获取 竺 预测 用 户 的 文化 差异 


析 预 测 文化 冲突 的 深度 学 习 方 法 ,包括 : 值 文化 差异 值 反 映 了 待 预测 用 户 迁 
C1) 步骤 S1 ,获取 待 预测 用 户 的 文化 差异 值 , 文 化 入 地 和 迁 出 地 之 间 的 文化 差异 

差异 值 反映 了 待 预测 用 户 迁 入 地 和 迁 出 地 之 间 的 文化 1 

差异 。 步骤 S2 : 获取 待 预测 用 户 的 文化 素养 


在 数据 库 中 存储 有 多 组 迁 入 地 与 迁 出 地 之 间 的 文 “| 值 ` 同类 群体 大 小 值 以 及 过 渡 时 长 值 
化 差异 值 。 当 获知 待 预测 用 户 的 迁 入 地 和 迁 出 地 时 , 则 | 
WY fe Cae Pe AE Pe RR eT FE AE ess 将 文化 差异 值 、 文 化 素养 值 、 
一 致 的 那 组 文化 差异 数据 ,从 而 获得 待 预 测 用 户 的 文化 LSE MELA Bea AAC. 
Se SEE HSC ACHE FEL ORT FB Le AE [Esti clearer adi 
地 之 间 的 文化 差异 。 

(2) 步骤 S2 ,获取 待 预测 用 户 的 文化 素养 值 . 同 类 
群体 大 小 值 以 及 过 渡 时 长 值 。 

(3) 步骤 S3 ,将 文化 差异 值 . 文 化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 长 值 输入 预先 训 
练 好 的 深度 学 习 模型 中 ,输出 待 预测 用 户 的 文化 冲突 事件 类 型 数据 。 

对 于 预先 训练 好 的 深度 学 习 模型 ,已 经 将 文化 差异 、 文 化 素养 .同类 群体 以 及 过 渡 时 长 
设置 为 深度 学 习 模 型 的 输入 变量 ,将 文化 冲突 事件 类 型 设置 为 深度 学 习 模 型 的 输出 变量 。 
因此 将 获取 的 待 预 测 用 户 的 文化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 长 值 的 数据 输入 预先 
训练 好 的 深度 学 习 模型 中 时 ,预先 训练 好 的 深度 学 习 模 型 会 计算 并 输出 对 应 的 待 预测 用 户 
的 文化 冲突 事件 类 型 数据 。 文 化 差异 值 反 映 了 迁 入 地 与 迁 出 地 的 文化 差异 程度 ,文化 素养 
反映 了 该 用 户 的 文化 程度 ,同类 群体 反映 的 是 与 该 用 户 移民 状态 一 致 或 类 似 的 人 群 ,过 渡 过 
长 反映 了 该 用 户 从 迁 出 地 的 文化 过 渡 到 迁 入 地 文化 所 需 的 时 长 。 

2, 基于 深度 学 习 模 型 的 文化 冲突 分 析 预 测 的 详细 方法 

在 一 个 技术 方案 中 ,在 获取 待 预测 用 户 的 文化 差异 值 之 前 , 须 获 取 数据 库 中 的 用 户 样本 
数据 ; 根据 用 户 样本 数据 获取 用 户 的 文化 差异 值 .文化 素养 值 .同类 群体 大 小 值 .过 渡 时 长 
值 以 及 文化 冲突 事件 类 型 数据 对 深度 学 习 模 型 进行 训练 。 

在 数据 库 中 存储 有 多 个 用 户 样本 数据 ,用 户 样本 数据 中 包含 了 多 个 用 户 的 文化 差异 值 、 
文化 素养 值 .同类 群体 大 小 值 、 过 渡 时 长 值 以 及 文化 冲突 事件 类 型 数据 。 在 深度 学 习 模 型 
中 ,预先 对 深度 学 习 模 型 的 输入 变量 与 输出 变量 进行 了 配置 ,将 文化 差异 .文化 素养 .同类 群 
体 以 及 过 渡 时 长 设置 为 深度 学 习 模型 的 输入 变量 ,将 文化 冲突 事件 类 型 设置 为 深度 学 习 模 
型 的 输出 变量 。 因 此 将 多 个 用 户 的 文化 差异 值 .文化 素养 值 . 同 类 群体 大 小 值 .过 渡 时 长 值 
以 及 文化 冲突 事件 类 型 数据 分 别 作为 深度 学 习 模型 的 输入 和 预期 输出 ,深度 学 习 模 型 会 根 
据 多 组 数据 进行 训练 。 训 练 后 的 深度 学 习 模 型 才能 根据 输入 数据 预测 输出 数据 。 对 深度 学 
习 模 型 进行 训练 能 使 得 获取 的 预测 结果 更 为 准确 。 


图 4-9 分 析 预 测 文化 冲突 
方法 的 流程 示意 图 
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在 一 个 技术 方案 中 ,根据 用 户 样本 数据 获取 用 户 的 文化 差异 值 . 文 化 素养 值 `. 同 类 群体 
大 小 值 .过 渡 时 长 值 以 及 文化 冲突 事件 类 型 数据 对 深度 学 习 模 型 进行 训练 ,包括 : 

根据 用 户 样本 数据 获取 用 户 的 文化 差异 值 .文化 素养 值 . 同 类 群体 大 小 值 以 及 过 渡 时 长 
值 ,将 其 输入 到 深度 学 习 模 型 中 进行 无 监督 训练 。 

从 用 户 样本 数据 中 获取 与 用 户 的 文化 差异 值 .文化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 
长 值 对 应 的 文化 冲突 事件 类 型 数据 ,将 用 户 的 文化 差异 值 . 文 化 素养 值 . 同 类 群体 大 小 值 以 
及 过 渡 时 长 值 作为 深度 学 习 模型 的 输入 数据 ,将 文化 冲突 事件 类 型 数据 作为 深度 学 习 模型 
的 预期 输出 ,对 深度 学 习 模 型 进行 有 监督 训练 。 

在 无 监督 训练 后 ,再 对 深度 学 习 模 型 进行 有 监督 训练 。 进 行 有 监督 训练 时 ,会 完整 地 提 
供 深度 学 习 模型 的 输入 数据 与 预期 输出 。 

用 户 样本 数据 中 存储 有 多 组 用 户 数据 ,每 组 用 户 数据 中 的 数据 类 型 包括 每 个 用 户 的 文 
化 差异 值 . 文 化 素养 值 . 同 类 群体 大 小 值 . 过 渡 时 长 值 以 及 文化 冲突 事件 类 型 数据 。 但 是 ,并 
不 是 每 组 用 户 数 据 都 是 完整 的 ,可 能 存在 有 的 用 户 数据 中 缺少 文化 冲突 事件 类 型 数据 ,这 部 
分 缺少 文化 冲突 事件 类 型 数据 的 用 户 数据 可 以 用 于 对 深度 学 习 模 型 进行 无 监督 训练 ,避免 
了 数据 的 浪费 。 由 于 无 监督 训练 预先 训练 了 深度 学 习 模 型 的 特征 提取 能 力 ,在 进行 了 无 监 
督 训 练 后 再 进行 有 监督 训练 也 能 提升 深度 学 习 模 型 的 训练 效果 ,提升 了 训练 后 的 深度 学 习 
模型 预测 输出 数据 的 准确 度 。 

在 一 个 技术 方案 中 ,在 获取 待 预测 用 户 的 文化 差异 值 之 前 , 须 获 取 迁 入 地 和 迁 出 地 的 本 
地 居民 的 问卷 调查 数据 。 问 卷 调查 数据 包括 对 预定 选项 的 选择 结果 。 根 据 如 下 公式 计算 待 
预测 用 户 的 文化 差异 值 : 

文化 差异 值 == 选 项 数量 差 值 / (参与 问卷 调查 的 本 地 居民 人 数 X1/2X 
问卷 调查 选项 的 总 和 ) 

其 中 ,选项 数量 差 值 为 调查 问卷 上 迁 入 地 与 迁 出 地 本 地 居民 之 间 对 每 一 个 选项 的 选择 
数量 的 差 值 绝对 值 相 加 和 ; 问卷 调查 选项 的 总 和 为 调查 问卷 中 选项 项 数 的 总 和 。 

文化 差异 值 反映 了 待 预测 用 户 的 迁 入 地 和 迁 出 地 之 间 的 文化 差异 。 获 取 文化 差异 值 的 
方法 主要 是 通过 问卷 调查 的 方式 ,问卷 调查 可 在 线 上 或 线 下 进行 。 问 卷 调查 选取 的 调查 对 
象 主要 是 本 地 居民 ,本 地 居民 指 在 本 地 出 生长 大 ,并 到 填写 问卷 调查 之 前 还 未 移居 至 其 他 城 
市 。 本 地 居民 的 限定 可 根据 研究 人 员 与 设计 人 员 的 考虑 而 定 , 例 如 研究 人 员 限 定 从 祖父 辈 
开始 定居 在 此 城市 的 居民 才 算 本 地 居民 。 

问卷 调查 上 有 多 个 预定 的 选择 题 与 对 应 的 多 个 选项 。 当 本 地 居民 填写 完毕 后 ,统计 调 
查 结果 。 具 体 的 统计 方式 为 ,统计 每 个 选项 的 选择 人 数 并 与 城市 对 应 统计 ,例如 第 一 题 有 2 
个 选项 ,选项 A 和 选项 B, 统 计 选择 选项 A .选择 选项 B 的 北京 居民 人 数 ,以 及 选择 选项 A、 
选择 选项 B 的 广州 居民 人 数 。 再 将 每 个 选项 迁 入 地 居民 与 迁 出 地 居民 选择 数量 的 差 值 的 
绝对 值 相 加 得 到 选项 数量 差 值 。 例 如 有 两 道 题 , 每 道 题 有 2 个 选项 A 和 B,3 个 北京 本 地 居 
民 与 3 个 广州 居民 参与 了 调查 。 第 1 题 有 1 个 北京 本 地 人 选 A,2 个 北京 本 地 人 选 B,2 个 
广州 本 地 人 选 A,1 个 广州 本 地 人 选 B; 第 2 题 有 3 个 北京 本 地 人 选 A,3 个 广州 本 地 人 选 
B。 那 么 ,第 1 题 的 选项 A 的 差 值 为 2 一 1=1, 第 1 题 的 选项 B 的 差 值 为 2 一 1=1; 第 2 题 的 
选项 A 的 差 值 为 3 一 0 二 3, 第 2 题 的 选项 B 的 差 值 也 为 3 一 0 二 3。 将 差 值 的 绝对 值 全 部 相 
加 得 到 选项 数量 差 值 . 则 选项 数量 差 值 为 1 十 1 十 3 十 3 二 8。 
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再 统计 问卷 调查 选项 的 总 和 , 即 为 问卷 调查 上 全 部 题目 的 全 部 选项 之 和 。 例 如 ,根据 上 
述 举 例 , 那 么 调查 选项 的 总 和 就 为 2 十 2 一 4。 那么 北京 与 广州 之 间 的 文化 差异 值 为 8 除 以 3 
再 除 以 4, 结果 为 2/3, 即 北京 与 广州 之 间 的 文化 差异 为 2/3。 

通过 获取 问卷 调查 的 数据 ,并 通过 计算 机 系统 进行 自动 计算 来 统计 得 到 多 个 迁 入 地 与 
迁 出 地 之 间 的 文化 差异 值 , 在 对 待 预测 用 户 的 文化 冲突 事件 类 型 进行 预测 时 , 则 可 直接 使 用 
已 经 统计 得 到 的 文化 差异 值 ,减少 了 每 一 次 都 需要 计算 文化 差异 值 的 步骤 ,使 得 预测 操作 更 
为 简单 。 

在 一 个 技术 方案 中 ,文化 素养 值 为 对 待 预测 用 户 的 学 历 进行 量化 得 到 的 值 ; 同类 群体 
大 小 值 为 与 待 预测 用 户 的 迁 入 地 与 迁 出 地 一 致 的 用 户 的 数量 。 

待 预测 用 户 的 文化 素养 值 , 是 指 根据 待 预测 用 户 的 学 历 量 化 得 到 的 值 。 量 化 标准 可 根 
据 研究 者 与 设计 者 的 考虑 而 定 。 例 如 ,将 小 学 学 历 量化 值 为 0, 初 中 学 历 量化 值 为 1 ,高 中 学 
历 量化 值 为 2, 大 学 学 历 量化 值 为 3, 硕士 学 历 量化 值 为 4, 博 士 学 历 量化 值 为 5, 博士 后 量化 
为 6。 因 此 可 根据 指定 的 学 历 量化 标准 ,在 获知 待 预测 用 户 的 学 历 信息 后 ,可 将 学 历 用 对 应 
的 数值 替代 。 学 历代 表 了 一 个 人 接受 教育 的 程度 ,也 能 在 一 定 程度 上 代表 一 个 人 的 文化 
素养 。 

待 预测 用 户 的 同类 群体 大 小 值 , 是 指 与 待 预测 用 户 的 迁 出 地 与 迁 入 地 均一 致 的 其 他 用 
户 的 数量 。 例 如 , 待 预测 用 户 A 的 迁 出 地 为 北京 , 迁 入 地 为 西安 ,那么 待 预测 用 户 A 的 同类 
群体 大 小 值 就 是 迁 出 地 为 北京 , 迁 入 地 为 西安 的 其 他 用 户 数量 ,也 可 以 称 之 为 迁 出 地 与 迁 和 人 
地 一 致 的 移民 数量 。 具 体 是 指 迁 出 地 与 迁 入 地 的 城市 一 致 的 移民 数量 。 例 如 , 当 待 预测 用 
户 A 的 迁 出 地 是 北京 ,而 迁 入 地 是 广州 ,那么 只 要 是 迁 出 地 属于 北京 市 的 范围 区 域 , 迁 入 地 
属于 广州 市 的 范围 区 域 的 移民 都 属于 待 预测 用 户 A 的 同类 群体 ,而 不 需要 考虑 这 些 移民 具 
体 的 迁 出 地 所 在 的 小 区 之 类 的 。 同 类 群体 越 大 ,说 明 从 某 一 个 地 方 集体 移民 过 来 的 可 能 性 
也 较 大 ,这 种 情况 下 ,这 部 分 人 在 较 长 时 间 还 是 保持 着 自己 过 去 的 文化 的 可 能 性 也 越 大 , 那 
么 融入 迁 入 地 文化 的 难度 也 越 大 。 故 有 必要 对 同类 群体 的 大 小 进行 统计 与 分 析 。 这 种 采用 
较 容易 获取 到 的 数据 对 待 预测 用 户 的 文化 冲突 进行 分 析 的 方法 ,使 得 调查 结果 会 更 客观 也 
更 准确 。 

在 一 个 技术 方案 中 ,过渡 时 长 值 根据 如 下 公式 计算 得 到 ， 

BM KM =T1 Xk% 十 Ts X (1 一 k%) 

其 中 , 为 待 预测 用 户 在 移民 到 迁 入 地 之 前 在 迁 入 地 停留 的 时 间 天 数 ，T: 为 待 预测 
用 户 在 移民 到 迁 入 地 之 前 接受 过 迁 入 地 文化 相关 的 学 习 时 间 天 数 ; &% 为 大 于 0 小 于 1 的 
预 设 权 值 。 

过 渡 时 长 值 ,是 为 了 获知 待 预 测 用 户 在 移民 至 迁 入 地 之 前 ,对 迁 和 地 的 文化 \ 环 境 等 了 
解 的 程度 。k% 是 区 分 Ti ST. 之 间 的 权重 ,若是 研究 人 员 或 设计 人 员 认 为 Ti 与 Te 的 权 
重 一 样 ,那么 可 将 & 设 为 50。 获 知 到 待 预测 用 户 在 移民 至 迁 入 地 之 前 停留 的 时 间 TT, 与 接 
受 迁 入 地 文化 相关 的 学 习 时 间 T, ,那么 此 待 预测 用 户 的 过 渡 时 长 值 也 可 获取 到 。T 与 Ts 
的 值 越 大 ,过 渡 时 长 值 也 会 越 大 ,表明 此 待 预测 用 户 对 于 迁 入 地 的 了 解 较 多 。 过 渡 时 长 值 也 
能 为 文化 冲突 的 预测 提供 一 种 新 的 思路 , 当 用 户 移民 至 某 个 迁 入 地 时 ,是 否 发 生 文化 冲突 与 
过 渡 时 长 存在 着 某 种 关联 ,也 可 为 有 关 部 门 提供 更 准确 的 分 析 数 据 和 更 优 的 文化 冲突 解决 
方案 。 
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3. 获取 推荐 过 渡 时 长 的 方法 
在 一 个 技术 方案 中 ,图 4-10 给 出 了 一 种 获取 推荐 过 渡 时 长 方法 的 流程 示意 图 ,该 方法 
包括 : 


步骤 S1: 当 文化 冲突 类 型 数据 表明 待 预测 用 户 存在 文化 冲突 时 ， 
将 待 预测 用 户 的 过 渡 时 长 值 设 为 原始 过 渡 时 长 值 


了 
步 又 S2 : 将 过 渡 时 长 值 按照 一 定 幅度 增加 | 
! 


步骤 S3 : 获取 过 渡 时 长 值 改变 后 通过 深度 学 习 输 出 的 文化 冲突 事件 类 型 数据 


i 


BPRS : 检测 输出 的 文化 冲突 事件 类 型 
_ 数 据 是 否 表明 待 预 测 用 户 存在 文化 冲突 _ 


Ra 


[me 
步 又 S5 : 将 当前 过 渡 时 长 值 设 为 标准 过 渡 时 长 ， 并 将 之 前 一 次 的 过 
渡 时 长 设 为 预警 过 渡 时 长 


1 

步骤 S6 : 将 标准 过 渡 时 长 值 与 预警 过 渡 时 长 值 的 平均 值 作为 下 一 次 过 渡 时 长 值 的 

输入 数据 ， 并 将 待 预测 用 户 的 文化 差异 值 、 文 化 素养 值 、 同 类 群体 大 小 值 一 起 输 

入 到 预先 训练 好 的 深度 学 习 神经 网 络 中 进行 计算 ， 获 取 输 出 的 文化 冲突 事件 类 型 

数据 
rr 
步骤 S7: 当 检测 到 输出 的 文化 冲突 事件 

类 型 数据 表明 待 预 测 用 户 不 存在 文化 冲突 时 ， 则 将 当前 过 渡 时 长 值 与 预警 时 长 ”让 一 一 
值 的 平均 值 作为 下 一 次 过 渡 时 长 值 的 输入 数据 


步 又 S8 : 获取 调整 后 的 过 渡 时 长 值 与 待 预测 用 户 的 文化 差异 值 、 文 化 素养 值 、 同 
类 群体 大 小 值 一 起 输入 到 预先 训练 好 的 深度 学 习 神经 网 络 中 进行 计算 ， 获 取 输 出 
的 文化 冲突 事件 类 型 数据 


步骤 $S9 : 检测 输出 的 文 
否 表 明 待 预测 用 


化 冲突 事件 类 型 数据 是 
户 存在 文化 冲突 


1 是 


步骤 S10 : 获取 当前 输出 文化 冲突 事件 
类 型 数据 对 应 的 过 渡 时 长 值 的 前 一 次 调整 的 过 渡 时 长 ， 即 推荐 过 渡 时 长 


图 4-10 获取 推荐 过 渡 时 长 方法 的 流程 示意 图 


(1) 步骤 S1, 当 文化 冲突 事件 类 型 数据 表明 待 预 测 用 户 存在 文化 冲突 时 ,将 待 预测 用 
户 的 过 渡 时 长 值 设 为 原始 过 渡 时 长 值 。 

(2) 步骤 S2, 将 过 渡 时 长 值 按照 一 定 幅度 增加 。 

(3) 步骤 S3 ,获取 过 渡 时 长 值 改变 后 通过 深度 学 习 输 出 的 文化 冲突 事件 类 型 数据 。 
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(4) 步骤 S4, 检 测 输出 的 文化 冲突 事件 类 型 数据 是 否 表 明 待 预测 用 户 存在 文化 冲突 ， 
若 否 , 则 执行 步骤 S5; 若是 , 则 执行 步骤 S2 。 

(5) 步骤 S5, 将 当前 的 过 渡 时 长 值 设 为 标准 过 渡 时 长 ,并 将 之 前 一 次 的 过 渡 时 长 设 为 
预警 过 渡 时 长 。 

将 待 预测 用 户 的 数据 对 应 输入 到 预先 训练 好 的 深度 学 习 模型 中 后 ,获取 对 应 输出 的 文 
化 冲突 事件 类 型 数据 。 当 输出 的 文化 冲突 事件 类 型 数据 表明 该 用 户 存在 文化 冲突 时 , 则 说 
明 此 用 户 还 需要 延长 过 渡 时 长 ., 即 学 习 迁 入 地 文化 的 时 间 。 先 将 待 预测 用 户 的 过 渡 时 长 值 
进行 按照 一 定数 值 固 定 增加 。 例 如 , 待 预测 用 户 的 过 渡 时 长 值 为 1, 设 定 增 加 幅度 为 10, 则 
将 过 渡 时 长 值 1 每 次 增加 10 ,并 将 对 应 增加 的 数值 11、21、31、41 等 作为 过 渡 时 长 项 的 输入 
数据 。 同 时 , 待 预测 用 户 的 其 他 数据 , 即 文化 差异 值 .文化 素养 值 ` 同 类 群体 大 小 值 等 均 保持 
不 变 ,并 与 每 次 增加 后 的 过 渡 时 长 值 输入 到 预先 训练 好 的 深度 学 习 模 型 中 进行 计算 ,获取 输 
出 的 文化 冲突 事件 类 型 数据 , 当 输 出 的 文化 冲突 事件 类 型 数据 表明 该 用 户 不 存在 文化 冲突 
时 , 则 停止 过 渡 时 长 值 的 增加 ,并 将 当前 过 渡 时 长 值 设 为 标准 过 渡 时 长 值 ,而 前 一 次 的 值 设 
为 预警 过 渡 时 长 值 。 

例如 , 设 定 的 增加 幅度 为 10, 当 将 过 渡 时 长 从 51 增加 到 61 时 ,过 渡 时 长 值 为 61 时 输 
出 的 文化 冲突 事件 类 型 数据 表明 该 用 户 不 存在 文化 冲突 ,那么 就 将 61 设 为 标准 过 渡 时 长 
值 ,而 前 一 次 的 值 , 即 51, 则 设 为 预警 过 渡 时 长 值 。 

(6) AG WR S6, 将 标准 过 渡 时 长 值 与 预警 过 渡 时 长 值 的 平均 值 作为 下 一 次 过 渡 时 长 值 的 
输入 数据 ,并 将 待 预 测 用 户 的 文化 差异 值 .文化 素养 值 \ 同 类 群体 大 小 值 一 起 输入 到 预先 训 
练 好 的 深度 学 习 模型 中 进行 计算 ,获取 输出 的 文化 冲突 事件 类 型 数据 。 

(7) 步骤 S7, 当 检测 到 输出 的 文化 冲突 事件 类 型 数据 表明 待 预 测 用 户 不 存在 文化 冲突 
时 , 则 将 当前 过 渡 时 长 值 与 预警 时 长 值 的 平均 值 作为 下 一 次 过 渡 时 长 值 的 输入 数据 。 

(8) 步骤 S8 ,获取 调整 后 的 过 渡 时 长 值 与 待 预测 用 户 的 文化 差异 值 . 文 化 素养 值 . 同 类 
群体 大 小 值 一 起 输入 到 预先 训练 好 的 深度 学 习 模 型 中 进行 计算 ,获取 输出 的 文化 冲突 事件 
类 型 数据 。 

(9) 步骤 S9, 检 测 输 出 的 文化 冲突 事件 类 型 数据 是 否 表明 待 预 测 用 户 存在 文化 冲突 ， 
若是 , 则 执行 步骤 S10; 否则 执行 步骤 S7。 

(10) 步骤 S10 ,获取 当前 输出 文化 冲突 事件 类 型 数据 对 应 的 过 渡 时 长 值 的 前 一 次 调整 
的 过 渡 时 长 , 即 推荐 过 渡 时 长 。 

得 到 标准 过 渡 时 长 后 ,再 将 标准 过 渡 时 长 值 与 预警 过 渡 时 长 值 的 平均 值 作为 下 一 次 
过 渡 时 长 值 的 输入 数据 , 即 采取 二 分 法 ,得 到 下 一 次 过 渡 时 长 值 的 输入 数据 。 当 输出 的 
文化 冲突 事件 类 型 数据 仍然 表明 待 预测 用 户 不 存在 文化 冲突 时 ,例如 输出 的 文化 冲突 事 
件 类 型 数据 均 为 0 时 , 则 继续 采用 二 分 法 ,将 当前 过 渡 时 长 值 与 预警 过 渡 时 长 值 的 平均 
值 作为 下 一 次 过 渡 时 长 值 的 输入 数据 。 依 次 取 值 ,直到 输出 的 文化 冲突 事件 类 型 数据 表 
明 待 预测 用 户 存在 文化 冲突 ,例如 输出 的 文化 冲突 事件 类 型 数据 不 均 为 0 时 , 则 获取 上 
一 次 输出 的 文化 冲突 事件 类 型 数据 为 0 时 对 应 的 过 渡 时 长 值 ,将 该 过 渡 时 长 值 设 为 推荐 
过 渡 时 长 值 。 而 推荐 过 渡 时 长 值 与 原始 过 渡 时 长 值 的 差 值 即 为 该 用 户 需要 延期 学 习 迁 
入 地 文化 的 时 长 。 

通过 改变 过 渡 时 长 值 研究 当 过 渡 时 长 值 达 到 怎样 的 数值 时 ,预测 输出 的 该 用 户 发 生 文 
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化 冲突 的 可 能 性 为 0。 首 先 将 过 渡 时 长 值 按 照 一 定 幅 度 增 加 , 尽 可 能 地 增加 过 渡 时 长 值 , 当 
输出 的 文化 冲突 事件 类 型 数据 均 为 0 时 , 则 表明 这 个 过 渡 时 长 值 对 应 的 培训 时 间 能 让 该 用 
户 发 生 文化 冲突 的 可 能 为 0。 在 此 基础 上 采取 二 分 法 ,缩小 过 渡 时 长 值 ,从 而 选择 最 优 的 一 
个 过 渡 时 长 ,避免 需要 培训 的 过 渡 时 间 过 长 ,也 避免 过 渡 时 间 不 够 不 能 达到 减少 文化 冲突 的 
效果 。 

在 一 个 技术 方案 中 ,将 用 户 的 文化 差异 值 比 作 电量 .文化 素养 值 比 作 能 承受 的 功率 , 同 
类 群体 大 小 值 比 作 电阻 ,过 渡 时 长 值 比 作 该 电量 完全 通过 该 电阻 的 时 长 , 即 电 流 时 长 ,文化 
冲突 事件 类 型 比 作 电路 故障 类 型 。 学 历 越 高 .文化 素养 越 高 . 即 能 承受 的 功率 也 越 高 。 当 知 
道 对 应 的 电量 与 电流 时 长 后 ,可 计算 出 对 应 的 功率 ,再 将 此 功率 与 能 承受 的 功率 进行 比较 。 
当 实际 功率 大 于 能 承受 的 功率 时 , 则 会 发 生 电路 故障 , 即 会 发 生 文化 冲突 ; 当 实 际 功率 小 于 
或 等 于 能 承受 的 功率 时 , 则 不 会 发 生 电 路 故障 , 即 不 会 产生 文化 冲突 。 

例如 , 当 移 民 A 的 数据 如 下 : 文化 差异 值 为 2, 文 化 素养 值 为 6, 同 类 群体 大 小 值 为 
2500, 过 渡 时 长 值 为 30, 当 移民 A 文化 冲突 事件 类 型 数据 为 {1,1,1,0,0} 时 ,对 应 地 ,电量 为 
2 ,能 承受 的 功率 为 6, 电阻 为 2500, 电 流 时 长 为 30, 电 路 故障 类 型 为 {1,1,1,0,0)。 基 于 上 
述 数 据 可 计算 得 到 电流 = 电量 /电流 时 长 ==2/30, 故 实际 功率 = 电流 ?X 电 阻 =2/30X2/30 
X2500 王 100/9=11, 这 种 情况 下 ,实际 功率 大 于 能 承受 的 功率 , 则 可 能 出 现 电 路 故障 。 这 种 
采用 物理 函数 类 比 的 方式 也 能 使 得 研究 人 员 更 好 地 了 解 这 几 项 之 间 的 关系 ,更 有 利于 分 析 
与 调查 。 

在 一 个 具体 的 技术 方案 中 ,根据 将 一 个 人 身上 的 文化 差异 作为 电量 (如 果 这 个 差异 需要 
消除 ,就 需要 这 个 电量 通过 这 个 人 从 正极 流 到 负极 ,从 而 实现 文化 融合 ) ,将 这 个 人 的 文化 素 
养 作 为 能 承受 的 功率 (因为 文化 素养 越 高 越 能 理解 和 承受 住 这 种 文化 变化 ,大 于 这 个 功率 就 
与 熔 丝 一 样 ,就 会 烧 断 ,这 个 人 就 会 出 现 问 题 ,例如 个 人 犯罪 .个 人 心理 问题 ,个 人 与 社会 的 
冲突 ; 如 果 不 超过 这 个 功率 ,那么 使 电量 通过 这 个 人 流动 ,这 个 人 就 能 实现 对 新 文化 的 认同 
或 在 这 个 人 身上 实现 两 种 文化 的 融合 ) ,将 这 个 人 的 同类 群体 大 小 作为 电阻 (因为 同类 群体 
越 大 ,被 转变 的 难度 就 越 大 ,例如 从 某 一 个 地 方 集体 移民 来 的 人 ,这 些 人 可 能 在 较 长 时 间 还 
是 保持 着 自己 过 去 的 文化 ) ,该 人 从 迁 出 地 文化 进入 迁 入 地 文化 的 过 渡 时 长 (例如 从 了 解 
另 一 种 文化 到 完全 移民 或 生活 到 另 一 种 文化 所 在 的 地 区 这 中 间 所 经 历 的 时 间 ) ,作为 该 
电量 完全 通过 该 电阻 的 时 长 ,从 而 可 以 计算 出 电流 ,进而 可 以 计算 出 功率 。 如 果实 际 功 
率 大 于 能 承受 的 功率 ,就 会 发 生 电 路 故障 ,就 对 应 着 发 生 文化 冲突 ; 如 果实 际 功率 不 大 于 
能 承受 的 功率 ,就 不 会 发 生 电 路 故障 ,就 对 应 着 不 发 生 文化 冲突 。 虽 然 这 些 在 意义 上 有 
对 应 关系 ,但 因为 单位 不 统一 ,难以 归 一 化 ,因此 需要 深度 学 习 模 型 进行 处 理 。 以 电量 、 
电阻 .电流 时 长 .可 承受 功率 对 应 的 实际 量 作为 深度 学 习 模 型 的 输入 ,将 是 否 发 生 文化 冲 
突 作 为 深度 学 习 模型 的 输出 (可 以 将 输出 分 为 几 种 类 型 ,如 犯罪 .出 现 精神 问题 .与 社会 
发 生 冲 突 等 ) , 先 通过 已 有 样本 进行 学 习 训练 ,然后 再 在 使 用 中 对 移民 的 文化 冲突 情况 进 
行 预测 ,进而 可 以 对 可 能 发 生 的 文化 冲突 进行 预防 ,并 可 以 通过 延长 电流 时 间 来 消解 文 
化 冲突 的 发 生 。 其 意义 在 于 能 够 对 个 人 的 文化 冲突 进行 预测 ,进而 为 预防 和 消解 文化 冲 
突 提供 决策 辅助 。 
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4.2.2 基于 深度 学 习 模 型 的 文化 冲突 分 析 预 测 系统 


在 一 个 技术 方案 中 ,如 图 4-11 所 示 ,提供 了 一 种 分 析 预 测 文化 冲突 的 装置 ,包括 : 

(1) 文化 差异 值 获取 模块 1, 用 于 获取 待 预测 用 户 的 文化 差异 值 。 文 化 差异 值 反 映 了 待 
预测 用 户 的 迁 入 地 和 迁 出 地 之 间 的 文化 差异 。 

(2) 待 预测 用 户 数据 获取 模块 2, 用 于 获取 待 预 测 用 户 的 文化 素养 值 .同类 群体 大 小 值 
以 及 过 渡 时 长 值 。 

(3) 分 析 预 测 模块 3, 用 于 将 文化 差异 值 文化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 长 值 
输入 到 预先 训练 好 的 深度 学 习 模 型 中 ,输出 待 预测 用 户 的 文化 冲突 事件 类 型 数据 。 

在 一 个 技术 方案 中 ,如 图 4-12 所 示 ,上述 分 析 预 测 文化 冲突 的 装置 包括 : 


文化 差异 什 
文化 差异 值 获取 模块 1 
获取 模块 1 
| 用户 样本 “| 待 预 测 用 户 数 ] 
待 预测 用 户 数 数据 获取 模块 4 据 获取 模块 2 
据 获取 模块 2 
i 训练 模块 5 分 析 预 测 模 块 3 


图 4-11 分 析 预 测 文化 冲突 装置 的 结构 框图 图 4-12 分 析 预 测 文化 冲突 装置 的 扩展 结构 框图 


(4) 用 户 样本 数据 获取 模块 4, 用 于 获取 数据 库 中 的 用 户 样本 数据 。 

(5) 训练 模块 5, 用 于 根据 用 户 样本 数据 获取 用 户 的 文化 差异 值 .文化 素养 值 、 同 类 群体 
大 小 值 .过渡 时 长 值 以 及 文化 冲突 事件 类 型 数据 对 深度 学 习 模 型 进行 训练 。 

在 一 个 技术 方案 中 ,上 述 训 练 模块 5 还 用 于 根据 用 户 样本 数据 获取 用 户 的 文化 差异 值 、 
文化 素养 值 、 同 类 群体 大 小 值 以 及 过 渡 时 长 值 .将 其 输入 到 深度 学 习 模 型 中 进行 无 监督 训 
练 ; 从 用 户 样本 数据 中 获取 与 用 户 的 文化 差异 值 .文化 素养 值 .同类 群体 大 小 值 以 及 过 渡 时 
长 值 对 应 的 文化 冲突 事件 类 型 数据 ,将 文化 差异 值 文化 素养 值 . 同 类 群体 大 小 值 以 及 过 渡 
时 长 值 作为 输入 数据 ,将 文化 冲突 事件 类 型 数据 作为 深度 学 习 模 型 的 预期 输出 ,对 深度 学 习 
模型 进行 有 监督 训练 。 

(6) 推荐 时 长 获取 模块 6( 可 选 模块 ,图 4-12 中 未 示 出 ), 当 文化 冲突 事件 类 型 数据 表明 待 
预测 用 户 存 在 文化 冲突 时 , 则 将 待 预测 用 户 的 过 渡 时 长 值 按照 一 定 幅 度 增加 ; 获取 当 文 化 冲 
突 事件 类 型 数据 表明 待 预测 用 户 不 存在 文化 冲突 时 对 应 的 过 渡 时 长 值 为 标准 过 渡 时 长 ; 逐步 
调整 标准 过 渡 时 长 ,并 将 每 次 调整 后 的 标准 过 渡 时 长 与 用 户 的 文化 差异 值 .文化 素养 值 . 同 类 群 
体 大 小 值 一 起 作为 输入 数据 输入 到 预先 训练 好 的 深度 学 习 模 型 中 ,直到 输出 的 文化 冲突 事件 类 
型 数据 表明 待 预测 用 户 存在 文化 冲突 ,此 时 获取 前 一 次 调整 的 标准 过 渡 时 长 为 推荐 过 渡 时 长 。 

在 一 个 技术 方案 中 ,上 述 分 析 预 测 文化 冲突 的 装置 包括 文化 差异 获取 模块 ,用 于 获取 迁 
入 地 和 迁 出 地 的 本 地 居民 的 问卷 调查 数据 。 问 卷 调查 数据 包括 对 预定 选项 的 选择 结果 。 


深度 学 习 模型 的 调度 推荐 大 数据 应 用 


深度 学 习 模 型 的 应 用 很 多 ,其 中 深度 学 习 模 型 的 调度 推荐 大 数据 应 用 有 着 非常 重要 的 
应 用 价值 和 前 景 。 本 章 给 出 了 3 种 深度 学 习 模 型 的 调度 推荐 大 数据 应 用 : 基于 大 数据 和 深 
度 学 习 模 型 的 云 计算 调度 ,基于 大 数据 和 深度 学 习 模 型 的 停车 引导 ,基于 大 数据 与 深度 学 习 
的 婚恋 对 象 推荐 。 


5.1 基于 大 数据 和 深度 学 习 模型 的 云 计算 调度 


当前 , 云 计算 技术 可 谓 是 计算 机 服务 领域 最 热门 的 话题 之 一 。 大 到 行业 的 领军 企业 ,如 
IBM、Google, 小 到 一 些 私 人 企业 ,甚至 一 些 乐 于 追求 新 技术 的 技术 人 员 ,都 在 部 署 或 研究 云 
计算 ,希望 通过 云 计算 来 巩固 或 提升 自己 在 行业 的 地 位 。 云 计算 环境 中 采用 虚拟 化 技术 ,将 
服务 器 整体 虚拟 化 为 一 个 数据 资源 池 , 由 于 数据 资源 种 类 多 、 规 模 大 ,因此 云 计 算数 据 资源 
调度 成 为 云 计算 研究 的 热点 之 一 。 

进行 云 计算 调度 ”1 时 ,最 重要 的 是 在 调度 之 前 预测 一 个 云 任 务 调度 到 某 类 云 资 源 上 
去 会 占用 多 少 云 资源 ,以 作为 调度 的 依据 。 现 有 的 云 计算 调度 基本 上 都 采用 了 预 估 式 , 通 过 
预 估 某 个 云 计 算 任 务 占 用 的 云 资源 量 ( 包 括 计算 、 内 存 、 外 存 、 网 络 等 资源 ) 和 剩余 云 资源 量 
进行 调度 。 现 有 技术 的 这 种 预 估 方 式 一 般 是 根据 任务 类 型 对 占用 的 云 资源 量 进行 粗略 估计 
的 ,但 这 种 粗略 估计 并 未 结合 过 去 对 云 资源 的 实际 占用 情况 进行 预测 ,因此 往往 是 不 准确 
的 ,导致 基于 此 的 调度 也 不 一 定 能 最 大 程度 地 利用 云 资源 ,调度 效率 不 高 。 

如 图 5-1 所 示 ,本 技术 研究 并 给 出 了 一 种 新 的 基于 大 数据 和 深度 学 习 模 型 的 云 计 算 调 
度 方法 及 系统 ,方法 包括 : 获取 需 调 度 的 云 任务 类 型 了 、 需 调度 的 T 类 型 云 任务 的 数量 M 
以 及 拟 调度 到 的 云 资源 候选 类 型 ; 从 过 去 能 力 大 数据 库 中 检索 出 所 有 从 类 型 了 的 云 任务 调 
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度 到 候选 类 型 的 云 资源 上 的 调度 记录 ; 根据 检索 出 的 所 有 过 去 调度 记录 ,采用 深度 学 习 模 
型 预测 调度 数量 M 的 T 类 型 云 任 务 到 候选 类 型 的 云 资源 时 会 占用 候选 类 型 云 资源 的 数 
量 ; 根据 预测 的 结果 完成 云 计算 调度 。 本 技术 基于 过 去 能 力 大 数据 和 深度 学 习 模 型 ,通过 
过 去 不 同类 型 的 云 任 务 调度 到 不 同 云 资源 上 时 对 云 资源 的 占用 情况 这 一 客观 事实 来 进行 预 
测 , 更 加 准确 ,调度 效率 更 高 。 本 技术 可 广泛 应 用 于 云 计算 领域 。 


获取 需 调度 的 云 任务 类 型 7、 需 调度 的 7 类 型 云 任务 的 数量 M 以 及 拟 调 度 到 的 
云 资源 候选 类 型 


了 
从 过 去 能 力 大 数据 库 中 检索 出 所 有 从 类 型 7 的 云 任务 调度 到 候选 类 型 的 云 资源 
的 调度 记录 


了 
根据 检索 出 的 所 有 过 去 调度 记录 ， 采 用 深度 学 习 神经 网 络 预测 调度 数量 M 的 
7 类 型 云 任务 到 候选 类 型 的 云 资源 时 会 占用 候选 类 型 云 资源 的 数量 


了 
根据 预测 的 结果 完成 云 计 算 调 度 


图 5-1 基于 大 数据 和 深度 学 习 模型 的 云 计算 调度 方法 的 整体 流程 图 


5.1.1 基于 大 数据 和 深度 学 习 模 型 的 云 计 算 调度 方法 


如 图 5-2 所 示 , 本 技术 云 计 算 调度 方案 的 一 种 具体 技术 方案 的 实现 步骤 如 下 : 

(1) 步骤 S1, 将 过 去 每 次 调度 中 不 同类 型 的 云 任 务 调度 到 不 同类 型 的 云 资源 上 时 云 任 
务 的 类 型 及 数量 、 云 资源 的 类 型 及 占用 数量 存 人 过 去 能 力 大 数据 库 。 

其 中 ,过 去 能 力 大 数据 库 用 于 存储 过 去 能 力 大 数据 。 过 去 能 力 大 数据 ,是 指 云 调度 的 当 
前 时 间 ( 即 需 进 行 云 调 度 预 测 的 时 间 ) 之 前 的 云 调度 记录 。 云 调度 记录 包括 调度 日 期 及 时 
间 、 云 任务 类 型 TT 类 型 云 任 务 的 数量 \、 云 资源 候选 类 型 和 占用 候选 类 型 云 资源 的 数量 等 。 
例如 ,过 去 能 力 大 数据 包括 : 

日 期 及 时 间 1, 云 任务 类 型 Ti ,TT 类 型 云 任 务 的 数量 Mu , 云 资源 候选 类 型 Ri ,候选 类 
型 云 资 源 的 数量 Ni ; 

日 期 及 时 间 2, 云 任务 类 型 T ,T 类 型 云 任务 的 数量 Ms , 云 资源 候选 类 型 Rs ,候选 类 
型 云 资源 的 数量 Na ; 

(2) 步骤 S2 ,获取 需 调 度 的 云 任务 类 型 了 、 需 调度 的 T 类 型 云 任务 的 数量 M 及 拟 调度 
到 的 每 一 云 资 源 候 选 类 型 。 

本 具体 技术 方案 拟 调度 到 的 云 资 源 类 型 至 少 一 个 ,可 以 是 一 种 类 型 或 多 种 备 选 类 型 , 云 
资源 候选 类 型 可 用 变量 R 表示。 


AU] 


B76 数据 处 理 与 深度 学 习 | 


步骤 S1 : 将 过 去 每 次 调度 中 不 同类 型 的 云 任务 调度 到 不 同类 型 的 云 资源 上 时 云 
任务 的 类 型 及 数量 、 云 资源 的 类 型 及 占用 数量 存 人 过 去 能 力 大 数据 库 


! 
步骤 $S2 : 获取 需 调度 的 云 任务 类 型 7、 需 调度 的 7 类 型 云 任务 的 数量 M 及 拟 调度 
到 的 每 一 云 资源 候选 类 型 


了 


步骤 S3 : 从 过 去 能 力 大 数据 库 中 检索 出 所 有 从 7 类 型 的 云 任务 调度 到 候选 类 型 的 
云 资源 上 的 调度 记录 


了 
步骤 S4: 根据 检索 出 来 的 每 个 调度 记录 中 云 任务 的 数量 及 云 资源 的 占用 情况 ， 
预测 调度 数量 M 的 7 类 型 云 任务 到 候选 类 型 云 资源 时 会 占用 候选 类 型 云 资源 的 
数量 


了 
BPRS : 将 预测 出 的 每 一 候选 类 型 云 资 源 对 应 的 数量 作为 调度 相同 数量 的 类 型 
7 云 任务 到 该 候选 类 型 云 资源 时 会 占用 该 候选 类 型 云 资源 的 数量 输出 给 云 计算 
调度 系统 ， 云 计算 调度 系统 根据 预测 的 结果 从 所 有 候选 类 型 云 资源 中 选择 一 个 
类 型 云 资源 进行 调度 


了 


BPRS: 在 数量 的 7 类 型 云 任务 被 调度 且 运 行 完成 后 ， 获 取 数 量 M 的 类 型 7 云 任 
务实 际 占用 的 被 调度 的 候选 类 型 云 资源 的 数量 ， 并 存 入 过 去 能 力 大 数据 库 


图 5-2 具体 技术 方案 的 实现 流程 图 


(3) 步骤 S3, 从 过 去 能 力 大 数据 库 中 检索 出 所 有 从 工 类 型 的 云 任务 调度 到 候选 类 型 的 
云 资 源 上 的 调度 记录 。 具 体 包括 : 

日 期 及 时 间 ky. EBA ToT RES AY BOE OM, , 云 资源 候选 类 型 ,候选 类 型 云 
资源 的 数量 Ni 

日 期 及 时 间 &, , 云 任务 类 型 ,TT 类 型 云 任务 的 数量 M,, 云 资源 候选 类 型 ,候选 类 型 云 
资源 的 数量 No ， 

如 果 从 工 类 型 的 云 任务 调度 到 候选 类 型 的 云 资 源 上 的 所 有 调度 记录 的 个 数 小 于 第 一 
预 设 阔 值 , 则 检索 出 从 与 T 类 型 匹配 度 大 于 符合 第 二 预 设 条 件 的 类 型 的 云 任 务 调度 到 与 候 
选 类 型 匹配 度 大 于 符合 第 三 预 设 条 件 的 类 型 的 云 资 源 上 的 所 有 调度 记录 ,这 样 做 的 目的 是 
确保 有 足够 的 数据 训练 预 设 深度 学 习 模 型 。 其 中 ,与 了 类 型 匹配 度 大 于 符合 第 二 预 设 条 件 
的 类 型 是 指 ,如 果 工 类 型 是 “打开 OFFICE2007”, 第 二 预 设 条件 为 任务 名 称 匹配 ,那么 类 型 
“打开 OFFICE2003? 属 于 与 工 类 型 匹配 度 符合 第 二 预 设 条 件 的 类 型 ,因为 二 者 的 任务 名 称 
“打开 OFFICE? 是 匹配 的 ,只 是 任务 版 本 号 不 一 致 。 与 候选 类 型 匹配 度 符合 第 三 预 设 条 件 
的 类 型 是 指 , 如 果 候 选 类 型 是 "Windows 2003”, 第 三 预 设 条 件 为 资源 名 称 匹 配 ,那么 类 型 
“Windows 2008” 属 于 与 候选 类 型 匹配 度 符合 第 三 预 设 条 件 的 类 型 ,因为 二 者 的 资源 名 称 
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“Windows” 是 匹配 的 ,只 是 资源 版 本 号 不 一 致 。 

(4) 步骤 S4, 根 据 检索 出 来 的 每 个 调度 记录 中 云 任务 的 数量 及 云 资源 的 占用 情况 , 预 
测 调度 数量 M 的 类 型 云 任务 到 候选 类 型 云 资源 时 会 占用 候选 类 型 云 资源 的 数量 。 

步骤 S4-1, 初 始 化 预 设 深度 学 习 模型 ,使 得 该 预 设 深度 学 习 模 型 的 输入 节点 能 接受 人 
类 型 云 任务 的 数量 作为 输入 ,并 使 得 输入 节点 能 接受 候选 类 型 云 资 源 的 数量 作为 输出 。 

步骤 S4-2 ,将 检索 出 来 的 每 个 调度 记录 按照 时 间 先 后 顺序 进行 排序 ,并 按照 排序 的 先 
后 依次 作为 训练 数据 对 预 设 深度 学 习 模 型 进行 训练 。 

例如 ,将 检索 出 来 的 每 个 调度 记录 按照 时 间 先 后 顺序 进行 排序 后 得 到 : 

日 期 及 时 间 ky BES RM T,T 类 型 云 任务 的 数量 Mi , 云 资源 候选 类 型 ,候选 类 型 云 
资源 的 数量 Ni， 

日 期 及 时 间 k,, 云 任务 类 型 ,TT 类 型 云 任务 的 数量 M; , 云 资源 候选 类 型 ,候选 类 型 去 
资源 的 数量 NN,; 

训练 时 ,首先 进行 如 下 无 监督 训练 

开 类 型 云 任 务 的 数量 M, 作为 训练 输入 数据 ,对 预 设 深 度 学 习 模型 进行 无 监督 训练 ; 

TT 类 型 云 任务 的 数量 M， 作为 训练 输入 数据 ,对 预 设 深度 学 习 模型 进行 无 监督 训练 ; 

然后 进行 如 下 有 监督 训练 : 

TT 类 型 云 任务 的 数量 M, 作为 训练 输入 数据 ,候选 类 型 云 资源 的 数量 Ni 作为 训练 预期 
输出 数据 ,对 预 设 深度 学 习 模 型 进行 有 监督 训练 ; 

TT 类 型 云 任务 的 数量 M， 作为 训练 输入 数据 ,候选 类 型 云 资源 的 数量 Ne 作为 训练 预期 
输出 数据 ,对 预 设 深度 学 习 模 型 进行 有 监督 训练 ; 

因为 越 是 最 近 的 训练 数据 ,对 调度 预测 的 参考 价值 越 大 ,所 以 本 有 具体 技术 方案 需要 按照 
时 间 先 后 顺序 进行 排序 ,并 按照 排序 的 先后 依次 作为 训练 数据 对 预 设 深度 学 习 模 型 进行 训 
练 ,这 样 做 的 好 处 是 : 越 是 最 近 时 间 的 训练 数据 越 是 最 后 对 深度 学 习 模 型 进行 训练 , 即 令 最 
近 时 间 的 训练 数据 对 训练 后 的 深度 学 习 模 型 的 影响 更 大 ,从 而 使 得 训练 后 的 深度 学 习 模 型 
更 能 反映 出 最 近 的 训练 数据 的 特征 。 

步骤 S4-3 ,将 需 调 度 的 云 任 务 数量 M 作为 训练 后 的 预 设 深度 学 习 模 型 的 输入 ,并 将 训 
练 后 的 预 设 深度 学 习 模型 计算 得 到 的 输出 作为 预测 出 的 云 资源 的 占用 数量 。 

(5) 步骤 S5 ,将 预测 出 的 每 一 候选 类 型 云 资 源 对 应 的 数量 作为 调度 相同 数量 的 类 型 了 
云 任务 到 该 候选 类 型 云 资 源 时 会 占用 该 候选 类 型 云 资源 的 数量 输出 给 云 计 算 调 度 系统 , 云 
计算 调度 系统 根据 预测 的 结果 从 所 有 候选 类 型 云 资源 中 选择 一 个 类 型 云 资源 进行 调度 。 

例如 ,有 疡 个 候选 类 型 尺 ,第 1 个 类 型 的 R 记 为 R 一 1, 其 对 应 的 数量 记 为 N 一 1; 第 2 
个 类 型 的 RR 记 为 R 一 2, 其 对 应 的 数量 为 N 一 2., 依 此 类 推 , 则 输出 给 云 计算 调度 系统 的 预测 
结果 为 : 

对 应 RR 一 1 的 N 一 1, 对 应 R 一 2 的 N 一 2.…… :对 应 R 一 m 的 N 一 m。 

云 计算 调度 系统 从 中 选择 一 种 候选 类 型 云 资源 进行 调度 这 一 过 程 ,可 具体 细 分 为 以 下 
步骤 : 
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步骤 S5-1, 获 取 每 一 候选 类 型 云 资源 的 剩余 资源 量 STA 和 单位 成 本 CTR s 

步骤 S5-2 ,判断 类 型 工 云 任务 是 否 可 以 拆 分 并 调度 到 不 同 云 资源 ,如 果 不 可 以 , 则 执行 
步骤 S5-3 ,如 可 以 则 执行 步骤 S5-4; 

步骤 S5-3, 从 所 有 候选 类 型 云 资 源 中 选择 一 个 剩余 资源 量 大 于 或 等 于 预测 占用 数量 
(预测 占用 数量 等 于 步骤 S4 预测 出 的 工 类 型 云 任 务 占 用 候选 类 型 云 资 源 的 数量 ) 且 总 成 本 
最 低 的 一 个 类 型 云 资源 进行 调度 。 

例如 : 

对 应 R 一 1 的 N 一 1,R 一 1 的 剩余 资源 量 为 STk 一 1, 单 位 成 本 为 CTk 一 1; 

对 应 R 一 2 的 N 一 2,R 一 2 的 剩余 资源 量 为 STk 一 2, 单 位 成 本 为 CTk 一 2; 

对 应 R—m 的 N 一 m,R 一 1 的 剩余 资源 量 为 STk 一 m, 单 位 成 本 为 CTk 一 m。 

如 果 N 一 1 三 STk 一 1, 则 计算 选择 R 一 1 的 总 成 本 (N 一 1) X (CTk 一 1) ,否则 不 考虑 对 
R 一 1 的 选择 ; 

如 果 N 一 2 三 STk 一 2, 则 计算 选择 R 一 2 的 总 成 本 (N 一 2) X (CTk 一 2) ,否则 不 考虑 对 
R 一 2 的 选择 ; 

如 果 N 一 m 三 STk 一 m, 则 计算 选择 R—m 的 总 成 本 (N 一 m) X (CTk 一 m) ,否则 不 考虑 
对 R 一 m 的 选择 ; 

从 所 有 计算 的 总 成 本 中 选 出 总 成 本 最 低 的 一 个 类 型 的 云 资源 进行 调度 。 

步 又 S5-4, 令 剩余 数量 M 的 初始 值 为 M ,从 所 有 尚未 被 调度 的 候选 类 型 云 资源 中 选择 
有 剩余 资源 量 且 单位 成 本 最 低 的 候选 类 型 云 资 源 , 如 果 选 择 的 候选 类 型 云 资源 的 剩余 预测 
占用 量 ( 剩 余 预 测 占用 数量 = 预测 占用 数量 X (CM'/ M) ) 小 于 或 等 于 相应 的 剩余 资源 量 , 则 
将 数量 M' 的 T 类 型 云 任 务 全 部 调度 到 该 候选 类 型 云 资源 ,如 果 选 择 的 候选 类 型 云 资源 的 
剩余 预测 占用 数量 大 于 相应 的 剩余 资源 量 , 则 从 数量 M' 的 类 型 云 任 务 中 拆 分 出 [M' x 
(剩余 资源 量 / 剩 余 预 测 占 用 数量 )] 数 量 的 T 类 型 云 任 务 调度 到 该 候选 类 型 云 资源 ,并 将 
M' 更 新 为 M'X(1 一 剩余 资源 量 / 剩 余 预 测 占用 数量 ) ,重复 这 个 步骤 直至 剩余 资源 量 大 于 
剩余 预测 占用 数量 。 

例如 : 

对 应 R 一 1 的 N 一 1,R 一 1 的 剩余 资源 量 为 STk 一 1, 单 位 成 本 为 CTk 一 1; 

对 应 R 一 2 的 N 一 2,R 一 2 的 剩余 资源 量 为 STk 一 2, 单 位 成 本 为 CTk 一 2; 

对 应 RR 一 m 的 N 一 m,R 一 1 的 剩余 资源 量 为 STk 一 m, 单 位 成 本 为 CTk 一 mm。 

按照 单位 成 本 从 低 到 高 排序 。 

令 M=M 

如 果 N 一 2 过 STk 一 2, 则 将 数量 M 的 T 类 型 云 任务 全 部 调度 到 R 一 2 类 型 云 资源 ; 

如 果 N 一 2 二 STk 一 2, 则 从 数量 M' 的 TT 类 型 云 任务 中 拆 分 出 [LM X (ST&k 一 2/N 一 2)] 
数量 的 工 类 型 云 任 务 调度 到 R 一 2 类 型 云 资源 ,并 将 M' 更 新 为 M'X (1 一 STk 一 2/N 一 2); 
接 下 来 对 CTk 一 4 进行 类 似 处 理 , 依 此 类 推 。 

本 具体 技术 方案 通过 步骤 S5-4 的 这 种 拆 分 可 以 实现 将 数量 M 的 T 类 型 云 任务 调度 
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到 多 个 候选 类 型 云 资源 时 的 总 成 本 最 低 。 

(6) 步骤 S6, 在 数量 的 全 类 型 云 任 务 被 调度 且 运 行 完 成 后 ,获取 数量 M 的 类 型 了 云 任 
务实 际 占 用 的 被 调度 的 候选 类 型 云 资源 的 数量 ,并 存 人 过 去 能 力 大 数据 库 。 

本 技术 具有 以 下 优点 : 

(1) 基于 过 去 能 力 大 数据 和 深度 学 习 模 型 ,通过 过 去 不 同类 型 的 云 任务 调度 到 不 同 云 
资源 上 时 对 云 资源 的 占用 情况 这 一 客观 事实 .来 对 调度 任务 中 相应 类 型 的 云 任务 调度 到 相 
应 类 型 云 资源 时 将 会 占用 的 资源 状况 进行 预测 ,与 现 有 粗略 估计 的 预 估 式 预测 方式 相 比 ,更 
加 准确 ,使 得 基于 本 技术 的 预测 结果 的 调度 能 最 大 程度 地 利用 云 资 源 , 调 度 效率 更 高 。 

(2) 通过 第 一 预 设 阔 值 .第 二 预 设 条 件 和 第 三 预 设 条 件 确保 了 有 足够 的 数据 训练 预 设 
深度 学 习 模 型 。 

(3) 训练 前 先 将 检索 出 的 每 个 过 去 调度 记录 按照 时 间 先 后 顺序 进行 排序 , 令 最 近 时 间 
的 训练 数据 对 训练 后 的 深度 学 习 模 型 的 影响 更 大 ,从 而 使 得 训练 后 的 深度 学 习 模型 更 能 反 
映 出 最 近 的 训练 数据 的 特征 。 

(4) 在 云 计算 调度 完成 后 ,本 技术 通过 将 实际 占用 的 云 资源 的 数量 存 和 人 过 去 能 力 大 数 
据 库 来 修正 和 不 断 更 新 实际 占用 的 云 资源 数量 ,使 得 预测 结果 更 加 准确 和 可 靠 。 


5.1.2 基于 大 数据 和 深度 学 习 模 型 的 云 计 算 调度 系统 


与 图 5-1 的 方法 相对 应 ,本 技术 基于 大 数据 和 深度 学 习 模型 的 云 计算 调度 系统 ,包括 以 
下 模块 : 

(1) 获取 模块 1, 用 于 获取 需 调 度 的 云 任务 类 型 了 . 需 调度 的 工 类 型 云 任务 的 数量 M 以 
及 拟 调 度 到 的 云 资 源 候选 类 型 。 

(2) 检索 模块 2, 用 于 从 过 去 能 力 大 数据 库 中 检索 出 所 有 从 类 型 了 的 云 任务 调度 到 候 
选 类 型 的 云 资源 上 的 调度 记录 ,过 去 能 力 大 数据 库存 储 有 过 去 每 次 调度 中 不 同类 型 的 云 任 
务 调度 到 不 同类 型 的 云 资源 上 时 云 任务 的 类 型 .T 类 型 云 任 务 的 数量 、 云 资源 候选 类 型 及 候 
选 类 型 云 资源 的 占用 数量 。 

(3) 预测 模块 3, 用 于 根据 检索 出 的 所 有 过 去 调度 记录 ,采用 深度 学 习 模 型 预测 调度 数 
量 M 的 T 类 型 云 任务 到 候选 类 型 的 云 资源 时 会 占用 候选 类 型 云 资源 的 数量 。 

预测 模块 3 包括 : 

初始 化 单元 3-1, 用 于 初始 化 预 设 深度 学 习 模 型 ,使 得 预 设 深度 学 习 模 型 的 输入 节点 能 
以 工 类 型 云 任务 的 数量 作为 输入 ,并 使 输出 节点 能 以 候选 类 型 云 资 源 的 数量 作为 输出 ; 

排序 与 训练 单元 3-2, 用 于 将 检索 出 的 每 个 过 去 调度 记录 按照 时 间 先 后 顺序 进行 排序 ， 
并 按照 排序 的 先后 依次 作为 训练 数据 对 预 设 深度 学 习 模型 进行 训练 ; 

预测 输出 单元 3-3 ,用 于 将 需 调 度 的 工 类 型 云 任务 的 数量 M 作为 训练 后 的 预 设 深 度 学 
习 模 型 的 输入 ,并 将 训练 后 的 预 设 深度 学 习 模 型 计算 得 到 的 输出 作为 预测 出 的 调度 数量 M 
的 TT 类 型 云 任务 到 候选 类 型 云 资源 时 会 占用 候选 类 型 云 资源 的 数量 。 

(4) 调度 模块 4, 用 于 根据 预测 的 结果 完成 云 计算 调度 。 
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5.2 基于 大 数据 和 深度 学 习 模型 的 停车 引导 


基于 大 数据 和 深度 学 习 模型 的 停车 引导 的 基本 方法 


传统 的 停车 引导 方法 "3 ,将 符合 用 户 要 求 的 所 有 停车 场 中 距离 用 户 预 设 目的 地 最 近 
的 停车 场 推荐 给 用 户 , 并 且 根 据 使 用 的 地 点 不 同 ,一 般 存 在 两 种 情况 。 

如 果 用 户 将 车 开 到 目的 地 后 使 用 停车 引导 ,如 图 5-3 所 示 ,那么 从 出 发 地 到 目的 地 的 距 
离 加 上 从 目的 地 到 被 推荐 的 停车 场 的 距离 总 会 大 于 (大 于 的 概率 非常 大 ) 或 等 于 从 出 发 地 到 
被 推荐 的 停车 场 的 距离 (因为 三 角形 的 两 边 长 之 和 肯定 大 于 第 三 边 长 ), 因 此 会 增加 用 户 的 
开车 里 程 、 延 长 用 户 的 开车 时 间 , 从 而 造成 用 户 成 本 的 增加 和 用 户 时 间 的 浪费 。 


停车 场 1 


停车 场 2 | 


停车 场 n 


目的 地 
(开始 引导 点 ) 


出 发 地 


图 5-3 传统 的 停车 引导 方法 示意 图 (一 ) 
如 果 用 户 在 出 发 地 或 距离 目的 地 较 远 处 使 用 停车 引导 ,如 图 5-4 所 示 , 那 么 符合 用 户 要 
求 的 停车 场 必然 较 远 , 因 此 会 导致 用 户 将 车 开 到 停车 场 需要 较 长 时 间 ,而 在 这 较 长 时 间 内 被 
推荐 的 停车 场 内 的 情况 已 经 发 生 了 变化 (例如 从 有 空闲 停车 位 变 为 无 空闲 停车 位 ) ,那么 就 


会 导致 用 户 停车 失败 。 


停车 场 1 


停车 场 2 


停车 场 n 


目的 地 


出 发 地 
(开始 引导 点 ) 


图 5-4 传统 的 停车 引导 方法 示意 图 (二 ) 


四 


此 ,传统 的 停车 引导 方法 存在 增加 用 户 成 本 或 者 停车 失败 的 问题 。 


本 技术 研究 并 给 出 了 一 种 新 的 停车 引导 方法 及 系统 ,用 于 辅助 用 户 选择 目的 地 附近 的 
停车 场 。 方 法 包括 : 获取 表示 用 户 到 达 目 的 地 时 间 的 第 一 时 间 ; 获取 预 设 的 筛选 条 件 ; 预 
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a1 i 


测 在 第 一 时 间 符 合 预 设 筛选 条 件 的 第 一 停车 场 集合 ; 根据 预测 结果 输出 具有 最 优 条 件 的 停 
车 场 。 系 统 包 括 时 间 获 取 模块 、 条 件 设置 模块 .预测 模块 .输出 模块 以 及 导航 模块 。 上 述 方 
法 及 系统 可 以 避免 停车 的 人 力 和 时 间 成 本 的 浪费 ,又 可 避免 停车 失败 的 问题 。 


5.2.1 基于 大 数据 和 深度 学 习 模 型 的 停车 引导 方法 
如 图 5-5 所 示 为 一 技术 方案 的 停车 引导 方法 流程 图 ,该 方法 用 于 辅助 用 户 选择 目的 地 


附近 的 停车 场 , 包 括 以 下 步骤 : 
开始 


| 步骤 S1 : 获取 表示 用 户 到 达 目 的 地 时 间 的 第 一 时 间 
i 


| 步骤 S2 : 获取 预 设 的 筛选 条 件 


步骤 S3 : 预测 在 第 一 时 间 符合 所 述 预 设 筛选 条 
件 的 第 一 停车 场 集合 


1 


| 步骤 $S4 : 根据 预测 结果 输出 具有 最 优 条 件 的 停车 场 


图 5-5 停车 引导 方法 流程 图 


(1) 步骤 S1, 获 取 表 示 用 户 到 达 目 的 地 时 间 的 第 一 时 间 。 第 一 时 间 不 是 用 户 开车 实际 
到 达 的 时 间 ,而 是 预计 可 能 到 达 目 的 地 的 时 间 ,与 实际 到 达 的 时 间 存 在 一 定 的 差别 ,但 一 般 
会 在 合理 的 误差 区 间 内 。 预 估 第 一 时 间 的 目的 ,是 预测 在 第 一 时 间 时 停车 场 的 车 位 状况 。 

(2) 步 又 S2 ,获取 预 设 的 筛选 条 件 。 预 设 的 筛选 条 件 可 以 用 来 筛选 目的 地 附近 的 停车 
场 ,一 般 是 符合 用 户 要 求 的 各 种 条 件 。 和 筛选 条 件 可 以 包括 距离 约束 条 件 和 车 位 空闲 状况 约 
束 条 件 。 其 中 距离 约束 条 件 是 指 以 目的 地 为 中 心 .约束 距离 为 半径 的 范围 。 车 位 空闲 状况 
约束 条 件 是 指 车 位 数量 、 比 例 等 。 

筛选 条 件 可 以 由 用 户 自行 设置 ,例如 用 户 选择 目的 地 方圆 500m 内 的 停车 场 、 停 车 位 数 
量 在 20 以 上 等 。 当 用 户 没 有 设置 筛选 条 件 时 , 调 取 默 认 条 件 , 例 如 目的 地 方圆 500m 内 的 
停车 场 、 停 车 位 数量 在 20 以 上 等 。 

(3) 步骤 S3 ,预测 在 第 一 时 间 符 合 预 设 得 选 条 件 的 第 一 停车 场 集合 。 预 测 目 的 地 附近 
的 各 停车 场 的 车 位 变化 ,并 根据 预 设 的 筛选 条 件 将 车 位 状况 变化 后 的 停车 场 进行 筛选 ,获得 
第 一 停车 场 集合 。 

(4) 步骤 S4, 根 据 预测 结果 输出 具有 最 优 条 件 的 停车 场 。 从 第 一 停车 场 集合 中 选择 一 
个 具有 最 优 条 件 的 停车 场 输出 。 该 最 优 条 件 可 以 是 距离 近 、 车 位 多 、 环 境 好 等 条 件 中 的 一 种 
或 多 种 条 件 的 综合 评价 。 输 出 方式 可 以 是 向 用 户 推荐 ,例如 ,输出 第 一 停车 场 集合 中 距离 目 
的 地 最 近 的 停车 场 。 
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上 述 停车 引导 方法 ,通过 预 估 车 辆 到 达 目 的 地 的 第 一 时 间 ,并 预测 在 第 一 时 间 时 各 停车 
场 的 车 位 变化 ,根据 预测 结果 推荐 停车 场 , 进 而 可 以 利用 导航 系统 规划 从 当前 位 置 到 达 具 有 
最 优 条 件 的 停车 场 的 路 线 。 该 方法 既 可 以 提前 规划 到 达 停 车 场 的 路 线 ,避免 人 力 和 时 间 成 
本 的 浪费 ,又 相对 准确 ,在 预测 算法 稳定 时 ,可 以 大 概率 避免 因 提前 设 定 停车 场 导致 停车 失 
败 的 问题 。 

基于 大 数据 和 深度 学 习 模 型 的 停车 引导 的 详细 方法 

在 步骤 Sl 中 , 当 用 户 比 较 熟 悉 目的 地 ,知道 从 出 发 地 到 目的 地 一 般 花 多 长 时 间 , 则 可 以 由 
用 户 提供 该 第 一 时 间 ， 当 用 户 没 有 提供 第 一 时 间 , 则 按照 如 下 方法 计算 第 一 时 间 , 如 图 5-6 


所 示 。 


| 步骤 S1-1 : 获取 当前 位 置 和 目的 地 位 置 


步骤 S1-2 : 计算 当前 位 置 和 目的 地 位 置 之 间 的 最 
优 路 径 的 长 度 ， 作 为 第 一 距离 
步骤 S1-3 : 根据 所 述 第 一 距离 和 车 速 计算 到 达 目 
的 地 所 需 的 第 一 时 长 


步 又 S1-4 : 将 当前 时 间 加 上 所 述 第 一 时 长 得 到 所 
述 第 一 时 间 


结束 
图 5-6 获取 第 一 时 间 的 方法 流程 图 


步骤 S1-1, 获 取 当 前 位 置 和 目的 地 位 置 。 获 取 当 前 位 置 的 方法 为 用 户 输入 或 定位 ( 例 
如 GPS 定位 ) 获 得 ,目的 地 位 置 为 用 户 预 设 。 

步骤 S1-2, 计 算 当 前 位 置 和 目的 地 位 置 之 间 最 优 路 径 的 长 度 , 作 为 第 一 距离 。 可 以 由 
车 载 导航 系统 获得 该 最 优 路 径 。 

AG YE S1-3, 根 据 第 一 距离 和 车 速 计算 到 达 目 的 地 所 需 的 第 一 时 长 。 车 速 可 以 是 一 段 时 
间 以 内 的 平均 车 速 ,也 可 以 是 结合 其 他 情况 计算 所 得 ,例如 根据 路 况 等 。 

步骤 S1-4, 将 当前 时 间 加 上 第 一 时 长 得 到 第 一 时 间 。 当 前 时 间 即 选择 停车 场 的 时 间 。 

当 开 始 采 用 上 述 技术 方案 的 方法 选择 停车 场 时 ,就 开始 执行 上 述 处 理 流 程 ,以 处 理 上 述 
流程 的 开始 时 间 为 当前 时 间 。 

如 图 5-7 所 示 , 上 述 步骤 S3 具体 可 以 采用 如 下 处 理 过 程 : 

步骤 S3-1 ,根据 距离 约束 条 件 筛选 出 第 二 停车 场 集合 。 即 搜索 并 筛选 在 距离 范围 内 的 
所 有 停车 场 , 作 为 第 二 停车 场 集合 。 

步骤 S3-2 ,将 第 二 停车 场 集合 中 、 当 前 时 间 每 一 停车 场 的 状况 输入 对 应 停车 场 的 已 训 
练 深度 学 习 模型 进行 深度 学 习 , 得 到 每 一 停车 场 的 已 训练 深度 神经 网 络 的 输出 。 即 通过 已 
训练 学 习 模 型 网 络 .根据 当前 停车 场 的 状况 预测 第 一 时 长 后 ( 即 第 一 时 间 ) 的 停车 场 的 状况 。 
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开始 
1 
步骤 S3-1: 根据 所 述 距离 约束 条 件 筛选 出 第 二 停车 场 集合 


1 

步骤 S3-2: 将 第 二 停车 场 集合 中 、 当 前 时 间 每 一 停车 场 的 

状况 输入 对 应 的 深度 学 习 模型 进行 深度 学 习 ， 得 到 所 述 每 
一 停车 场 的 深度 学 习 模型 的 输出 


1 
步骤 S3-3 : 将 所 述 每 一 停车 场 的 深度 学 习 模型 的 输出 作为 
对 应 停车 场 在 所 述 第 一 时 间 的 空闲 状况 


步骤 S3-4: en 从 第 二 停车 场 集合 中 入 
出 第 一 停车 场 集合 


图 5-7 预测 过 程 的 具体 方法 流程 图 


步骤 S3-3 ,将 每 一 停车 场 的 已 训练 深度 学 习 模 型 的 输出 作为 对 应 停车 场 在 第 一 时 间 
的 空闲 状况 。 空 闲 状况 可 以 采用 空闲 车 位 的 比例 .数量 或 根据 比例 .数量 定义 的 预 设 状 
态 来 表示 。 例 如 ,0 儿 表 示 完 全 空闲 ,50 儿 表示 一 半空 闲 ,100 多 表示 零 空闲 ; 停车 场 的 空 
闲 状 况 也 可 以 用 “非常 空 闪 ”比较 空 闻 ”不 空 闪 ”等 预 设 状态 来 表示 ,为 了 便于 计算 ,这 
些 预 设 状态 可 以 对 应 为 数字 编码 ,例如 “非常 空闲 ”对 应 1“ 比 较 空闲 ”对 应 2“ 不 空闲 ” 
对 应 3 等 。 

步骤 S3-4 ,根据 空闲 状况 约束 条 件 从 第 二 停车 场 集合 中 筛选 出 第 一 停车 场 集合 。 

从 第 二 停车 场 集合 中 筛选 出 第 一 时 间 的 空闲 状况 符合 空闲 状况 约束 条 件 的 停车 场 加 入 
第 一 停车 场 集合 。 

由 于 深度 学 习 模 型 的 预测 精度 非常 高 (这 已 经 在 很 多 应 用 中 得 到 了 印证 ,例如 图 像 识 
别 .语音 识别 ,而 空闲 状况 与 图 像 数 据 或 语音 数据 没有 本 质 上 的 区 别 。 例 如 将 停车 场 中 每 个 
车 位 作为 一 个 像素 点 ,如 果 占 用 则 该 像素 点 为 黑 , 和 否则 为 白 , 则 每 个 时 间 的 停车 场 的 空闲 状 
况 都 可 以 用 一 个 图 像 来 表示 ) ,所 以 可 以 高 精度 地 预测 到 停车 场 在 车 子 到 达 预 设 目的 地 时 的 
空闲 状况 。 

在 预测 步骤 S3-2 之 前 ,包括 步骤 S3-2 : 采用 第 二 停车 场 集合 中 .具有 第 一 时 长 跨度 的 
每 一 停车 场 空 闲 状况 数据 训练 对 应 停车 场 的 深度 学 习 模型 ,得 到 每 一 停车 场 的 深度 学 习 模 
型 。 深 度 学 习 模 型 一 般 需 要 输入 大 量 有 效 的 数据 对 其 进行 训练 ,才能 在 预测 时 更 加 准确 。 
本 技术 方案 中 ,由 于 需要 预测 第 一 时 长 后 的 车 位 状况 变化 ,因此 需要 输入 具有 第 一 时 长 跨度 
的 停车 场 空闲 状况 数据 对 停车 场 的 深度 神经 网 络 进行 训练 。 

如 图 5-8 所 示 , 采 用 具有 第 一 时 长 跨度 的 每 一 停车 场 的 空闲 状况 数据 训练 一 个 深度 学 
习 模 型 ,得 到 每 一 停车 场 的 已 训练 深度 神经 网 络 , 具 体 可 以 包括 以 下 步 又 : 

步骤 S3-2-1 ,初始 化 一 个 具有 预 设 层 数 个 中 间 层 的 深度 学 习 模 型 。 

将 深度 学 习 模型 的 输入 层 及 输出 层 的 数据 结构 初始 化 为 每 一 停车 场 的 空闲 状况 数据 的 
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C 开始 ) 
了 
步骤 S3-2-1 : 初始 化 一 个 具有 预 设 层 数 个 中 间 层 的 深度 学 习 模型 | 
步骤 S3-2-2' : 选取 任意 一 对 具有 第 一 时 长 跨度 的 起 始 时 间 和 结束 时 间 ， 并 在 起 始 
时 间 和 结束 时 间 之 间 选 取 具 有 停车 场 空闲 状况 数据 的 预 设 层 数 个 中 间 时 间 

有 
步 又 S3-2-3' : 将 起 始 时 间 的 一 个 停车 场 空闲 状况 数据 、 每 一 中 间 时 间 的 一 个 停车 
场 空闲 状况 数据 和 结束 时 间 的 一 个 停车 场 空闲 状况 数据 分 别 输入 所 述 深度 学 习 模 
型 的 输入 层 、 对 应 中 间 层 和 输出 层 ， 对 所 述 深度 学 习 模 型 进行 训练 


县 
十 


步骤 S3-2-4' : 是 否 进行 下 一 次 训练 


否 


图 5-8 训练 深度 学 习 模 型 的 方法 流程 图 


数据 结构 。 或 者 ,也 可 以 将 深度 学 习 模型 的 输入 层 及 输出 层 的 数据 结构 初始 化 为 每 一 停车 
场 的 空闲 状况 数据 可 以 转化 成 的 数据 结构 。 同 时 ,将 深度 学 习 模型 初始 化 出 预 设 层 数 个 中 
间 层 。 中 间 层 的 预 设 层 数 可 以 是 任 一 大 于 或 者 等 于 0 且 小 于 或 者 等 于 第 一 时 长 跨度 中 除 起 
始 时 间 和 结束 时 间 之 外 的 具有 停车 场 空闲 状况 数据 的 时 间 的 个 数 。 

步骤 S3-2-2 ,选取 任意 一 对 具有 第 一 时 长 跨度 的 起 始 时 间 和 结束 时 间 , 并 在 起 始 时 间 
和 结束 时 间 之 间 选 取 具 有 停车 场 空闲 状况 数据 的 预 设 层 数 个 中 间 时 间 。 选 取 的 一 对 起 始 时 
间 和 结束 时 间 可 以 是 历史 上 任意 的 时 间 ,并且 在 该 时 间 有 相关 的 停车 场 空闲 状况 数据 。 优 
选 地 ,可 以 选取 历史 上 每 一 天 与 本 次 预测 对 应 的 出 发 时 间 和 到 达 时 间 。 

步骤 S3-2-3 ,将 起 始 时 间 的 每 一 停车 场 的 空闲 状况 数据 ,每 一 中 间 时 间 的 每 一 停车 场 
的 空闲 状况 数据 和 结束 时 间 的 每 一 停车 场 的 空闲 状况 数据 分 别 输入 深度 学 习 模 型 的 输入 
层 、 对 应 中 间 层 和 输出 层 , 对 深度 学 习 模型 进行 训练 。 将 每 一 停车 场 历史 上 的 实际 数据 输入 
到 深度 学 习 模型 中 进行 训练 ,可 以 获得 每 一 停车 场 的 深度 学 习 模型 。 训 练 的 数据 越 有 效 且 
训练 数据 量 越 大 ,预测 的 结果 越 准 确 。 

步骤 S3-2-4 ,判断 是 否 对 深度 学 习 模型 进行 下 一 次 训练 ,若是 , 则 回 到 步骤 S3-2-2 , 重 
新 执行 上 述 各 步骤 ,否则 结束 并 将 深度 学 习 模型 作为 每 一 停车 场 的 已 训练 深度 学 习 模型 。 
在 执行 此 次 预测 之 前 ,都 可 以 利用 每 一 停车 场 的 已 有 数据 持续 对 深度 学 习 模 型 进行 训练 , 直 
到 利用 验证 集 对 深度 学 习 模 型 进行 验证 时 得 到 的 误差 小 于 阔 值 为 止 。 

判断 的 步骤 是 : 

选取 距离 当前 时 间 最 近 的 一 对 具有 第 一 时 长 跨度 的 起 始 时 间 和 结束 时 间 ; 

将 起 始 时 间 的 每 一 停车 场 的 空闲 状况 数据 输入 深度 学 习 模 型 的 输入 层 , 然 后 通过 深度 
学 习 模 型 的 深度 学 习 得 到 深度 学 习 模 型 的 输出 层 的 输出 结果 ; 

将 输出 结果 与 结束 时 间 的 每 一 停车 场 的 空闲 状况 数据 进行 对 比 , 如 果 对 比 得 到 的 误差 
大 于 预 设 阔 值 , 则 对 深度 学 习 模型 进行 下 一 次 训练 ,否则 结束 训练 并 将 深度 学 习 模 型 作为 每 
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一 停车 场 的 已 训练 深度 学 习 模 型 。 

在 预测 步骤 S3-2 之 前 ,深度 学 习 模 型 也 可 以 是 已 经 训练 成 型 ,可 以 直接 在 步骤 S3-2 中 
使 用 。 

上 述 训 练 过 程 中 所 涉及 的 数据 , 即 起 始 时 间 的 停车 场 空闲 状况 数据 和 结束 时 间 的 停车 
场 空闲 状况 数据 都 存 人 大 数据 ,并 且 还 将 各 停车 场 的 实时 空闲 状况 数据 都 存 人 大 数据 。 这 
些 大 量 的 数据 可 以 用 作 大 数据 分 析 , 进 一 步 帮助 提高 预测 的 准确 性 。 


5.2.2 基于 大 数据 和 深度 学 习 模 型 的 停车 引导 系统 


1. 基于 大 数据 和 深度 学 习 模 型 的 停车 引导 系统 的 基本 模块 
如 图 5-9 所 示 , 停 车 引导 系统 包括 时 间 获 取 模 块 1、 条 件 设置 模块 2、 预 测 模块 3、 输 出 模 
块 4 以 及 导航 模块 7。 


| 时 间 获 取 模 块 1 条 件 设置 模块 2 


oes ee 


训练 模块 5 -一 预测 模块 3 
大 数据 6 | 输出 模块 4 
导航 模块 7 


图 5-9 停车 引导 系统 模块 图 


(1) 时 间 获 取 模块 1, 用 于 获取 表示 用 户 到 达 目 的 地 时 间 的 第 一 时 间 。 第 一 时 间 不 是 用 
户 开车 实际 到 达 的 时 间 ,而 是 预计 可 能 到 达 目 的 地 的 时 间 ,与 实际 到 达 的 时 间 存 在 一 定 的 差 
别 , 但 一 般 会 在 合理 的 误差 区 间 内 。 预 估 第 一 时 间 的 目的 ,是 预测 在 第 一 时 间 时 停车 场 的 车 
位 状况 。 

(2) 条 件 设置 模块 2, 用 于 获取 预 设 的 筛选 条 件 。 预 设 的 筛选 条 件 可 以 用 来 筛选 目的 地 
附近 的 停车 场 ,筛选 条 件 一 般 是 符合 用 户 要 求 的 各 种 条 件 。 筛 选 条 件 可 以 包括 距离 约束 条 
件 和 车 位 空闲 状况 约束 条 件 。 其 中 距离 约束 条 件 是 指 以 目的 地 为 中 心 ,约束 距离 为 半径 的 
范围 。 车 位 空闲 状况 约束 条 件 是 指 车 位 数量 、 比 例 等 满足 一 定 的 条 件 。 

筛选 条 件 可 以 由 用 户 自行 设置 ,例如 用 户 选择 目的 地 方圆 500m 内 的 停车 场 、 停 车 位 数 
量 在 20 以 上 等 。 当 用 户 没有 设置 筛选 条 件 时 , 调 取 默认 条 件 。 

(3) 预测 模块 3, 用 于 预测 在 第 一 时 间 符 合 预 设 筛选 条 件 的 第 一 停车 场 集合 。 

(4) 输出 模块 4, 根据 预测 结果 输出 具有 最 优 条 件 的 停车 场 。 从 第 一 停车 场 集合 中 选择 
一 个 具有 最 优 条 件 的 停车 场 输出 。 该 最 优 条 件 可 以 是 距离 近 、 车 位 多 、 环 境 好 等 条 件 中 的 一 
种 或 多 种 条 件 的 综合 评价 。 

(5) 导航 模块 7, 利 用 导航 系统 规划 从 当前 位 置 到 达 具 有 最 优 条 件 的 停车 场 的 路 线 。 

上 述 停车 引导 系统 ,通过 预 估 车 辆 到 达 目 的 地 的 第 一 时 间 , 并 预测 在 第 一 时 间 时 各 停车 
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场 的 车 位 变化 ,根据 预测 结果 推荐 停车 场 ,进而 可 以 利用 导航 系统 规划 从 当前 位 置 到 达 具 有 
最 优 条 件 的 停车 场 的 路 线 。 该 方法 既 可 以 提前 规划 到 达 停 车 场 的 路 线 , 避 免 人 力 和 时 间 成 
本 的 浪费 ,又 相对 准确 ,在 预测 算法 稳定 时 ,可 以 大 概率 避免 因 提前 设 定 停车 场 导 致 停车 失 
败 的 问题 。 

2. 基于 大 数据 和 深度 学 习 模 型 的 停车 引导 系统 的 扩展 模块 

时 间 获 取 模 块 1 可 以 包括 供用 户 输 入 第 一 时 间 的 输入 单元 ,由 用 户 提 供 该 第 一 时 间 。 
例如 ,用 户 比较 熟悉 目的 地 ,知道 从 出 发 地 到 目的 地 一 般 花 多 长 时 间 , 则 可 以 由 用 户 提 供 该 
第 一 时 间 。 


如 图 5-10 所 示 , 时 间 获 取 模块 1 也 可 以 包括 位 置 获取 单元 1-1、 了 
距离 计算 单元 1-2、 时 长 计算 单元 1-3 以 及 时 间 计 算 单元 1-4。 | 

位 置 获取 单元 1-1, 用 于 获取 当前 位 置 和 目的 地 位 置 。 获 取 —1_— 
当前 位 置 的 方法 为 用 户 输入 或 定位 获得 ,目的 地 位 置 为 用 户 uni eel? 
预 设 。 1 

距离 计算 单元 1.2, 用 于 计算 当前 位 置 和 目的 地 位 置 之 间 最 时 长 计算 单元 1-3 
优 路 径 的 长 度 , 作 为 第 一 距离 。 | 

时 长 计算 单元 1-3, 用 于 根据 第 一 距离 和 车 速 计算 到 达 目 的 时 间 计算 单元 1.4 


所 需 的 第 一 时 长 。 

时 间 计 算 单 元 1-4, 用 于 将 当前 时 间 加 上 第 一 时 长 得 到 第 一 “图 5 10 时 间 获 取 模块 的 
时 间 。 一 种 具体 模块 图 

如 图 5-11 所 示 ,条 件 设置 模块 2 可 以 包括 用 户 设置 单元 2-1 和 系统 设置 单元 2-2。 用 
户 设置 单元 2-1 供用 户 设置 预 设 的 筛选 条 件 。 系 统 设置 单元 2-2 设置 系统 默认 条 件 ,用 于 
当 用 户 没有 设置 筛选 条 件 时 供 调 取 。 

如 图 5-12 所 示 ,预测 模块 3 包括 依 距 离 筛选 单元 3-1 .深度 神经 网 络 处 理 单元 3-2 以 及 
依 空闲 状况 第 选单 元 3-3。 


依 距离 筛选 单 
元 3-1 
用 户 输入 t 
深度 神经 网 络 
用 户 设置 单元 2-1|- -| 系统 设置 单元 2-2 处 理 单元 3-2 
1 
依 空闲 状况 入 
筛选 条 件 输出 选单 元 3-3 
图 5-11 条 件 设置 模 块 的 一 种 具体 模块 图 图 5-12 预测 模块 的 一 种 具体 模块 图 


依 距离 第 选单 元 3-1, 用 于 根据 距离 约束 条 件 筛选 出 第 二 停车 场 集合 。 

深度 神经 网 络 处 理 单元 3-2. 用 于 将 第 二 停车 场 集合 中 、 当 前 时 间 每 一 停车 场 的 状况 
输入 对 应 停车 场 的 已 训练 深度 学 习 模 型 进行 深度 学 习 , 得 到 每 一 停车 场 的 已 训练 深度 学 
习 模 型 的 输出 ; 并 将 每 一 停车 场 的 已 训练 深度 学 习 模 型 的 输出 作为 对 应 停车 场 在 第 一 时 
间 的 空闲 状况 。 空 闲 状 况 采 用 空闲 车 位 的 比例 、 数 量 或 根据 比例 、 数 量 定义 的 预 设 状态 
来 表示 。 
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依 空闲 状况 筛选 单元 3-3, 用 于 根据 空闲 状况 约束 条 件 从 第 二 停车 场 集合 中 筛选 出 第 
一 停车 场 集 合 。 即 从 第 二 停车 场 集合 中 筛选 出 第 一 时 间 的 空闲 状况 符合 空闲 状况 约束 条 件 
的 停车 场 加 入 第 一 停车 场 集合 。 

停车 引导 系统 还 可 以 包括 训练 模块 5。 训 练 模块 5 用 于 采用 第 二 停车 场 集合 中 、 具 有 
第 一 时 长 跨度 的 每 一 停车 场 空闲 状况 数据 训练 对 应 停车 场 的 深度 学 习 模 型 ,得 到 每 一 停车 
场 的 深度 学 习 模 型 。 如 图 5-13 所 示 ,训练 模块 5 包括 选择 单元 5-1 .训练 单元 5-2 以 及 循环 
控制 单元 5-3。 


选择 单元 5-1 [一 一 一 | ”训练 单元 5-2 


循环 控制 单元 5-3 


图 5-13 训练 模块 的 一 种 具体 模块 图 


选择 单元 5-1, 用 于 选取 任意 一 对 具有 第 一 时 长 跨度 的 起 始 时 间 和 结束 时 间 。 

训练 单元 5-2, 将 起 始 时 间 的 每 一 停车 场 空闲 状况 数据 和 结束 时 间 的 每 一 停车 场 空闲 
状况 数据 输入 每 一 停车 场 的 深度 学 习 模 型 进行 训练 。 

循环 控制 单元 5-3, 用 于 控制 选择 单元 5-1 和 训练 单元 5-2 重复 工作 。 

停车 引导 系统 还 可 以 包括 大 数据 6, 用 于 存储 起 始 时 间 的 停车 场 空闲 状况 数据 和 结束 
时 间 的 停车 场 空闲 状况 数据 。 上 述 训练 过 程 中 所 涉及 的 数据 , 即 起 始 时 间 的 停车 场 空闲 状 
况 数据 和 结束 时 间 的 停车 场 空闲 状况 数据 都 存 人 大 数据 ,并 且 还 将 各 停车 场 的 实时 空闲 状 
况 数据 都 存 人 大 数据 。 这 些 大 量 的 数据 可 以 用 作 大 数据 分 析 , 进 一 步 帮 助 提高 预测 的 准 
确 性 。 


5.3 ”基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹 配 推 荐 


大 数据 指 需 要 新 处 理 模式 才能 具有 更 强 的 决策 力 洞察 发 现 力 以 及 流程 优化 能 力 的 海 
量 、 高 增长 率 和 多 样 化 的 信息 资产 "3 。 在 日 常生 活 中 发 现 ,夫妻 往往 是 有 夫妻 相 的 ,因为 
人 的 长 相 是 与 基因 相关 的 ,而 基因 与 人 的 性 格 等 各 方面 相关 。 

现 有 婚介 机 构 或 网 站 向 用 户 随 机 或 根据 红娘 的 经 验 向 用 户 推荐 婚恋 对 象 , 没 有 客观 依 
据 , 使 得 推荐 的 婚恋 对 象 与 用 户 的 匹配 度 低 。 


5.3.1 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹配 推荐 方法 


1. 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹配 推荐 的 基本 方法 
如 图 5-14 所 示 ,在 一 个 技术 方案 中 ,提出 了 一 种 婚恋 对 象 匹配 数据 处 理 方法 ,包括 以 下 
步 又: 
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(1) 步骤 S1, 获 取 待 匹配 的 第 一 和 第 二 对 象 图 
步骤 S1 : 获取 待 匹配 的 第 一 和 第 二 对 象 图 

像 数据 。 像 数据 

其 中 ,第 一 、 第 二 对 象 图 像 数据 是 分 别 表征 第 一 
和 第 二 对 象 特征 的 数据 ,可 以 是 拍摄 的 图 片 ,也 可 以 [p67 ae CA OREM 
是 对 图 片 进行 图 像 特征 提取 后 的 图 像 特征 数据 ,其 “| 已 训练 的 深度 学 习 模型 ， 深 度 学 习 神经 网 
中 第 一 和 第 二 对 象 分 别 为 请 求 匹配 对 象 和 待 推荐 对 | Me cee Ne 
象 。 第 一 .第 二 对 象 图 像 数 据 可 以 携带 在 终端 发 送 
的 匹配 请 求 中 ,也 可 以 是 从 服务 器 获取 的 第 一 .第 二 [一 EE 
对 象 图 像 数据 。 在 一 个 技术 方案 中 ,第 二 对 象 图 像 | NSD, SEE Re Bt 
数据 是 从 服务 器 存储 的 注册 用 户 对 应 的 图 像 信息 提 
取 的 图 像 数据 , 随 着 注册 用 户 信息 更 新 。 在 一 个 技 ym nm 
术 方 案 中 ,第 一 和 第 二 对 象 图 像 数据 是 分 别 从 第 一 | 对象 下 各 度 . 
和 第 二 对 象 图 像 中 提取 人 脸 区 域 得 到 的 。 

(2) 步骤 S2, 将 第 一 和 第 二 对 象 图 像 数 据 输入 图 5-14 婚恋 对 象 匹配 数据 
已 训练 的 深度 学 习 模 型 ,深度 学 习 模 型 的 参数 是 根 处 理 方法 的 流程 图 
据 已 婚 匹 配对 象 对 应 的 匹配 图 像 大 数据 训练 得 到 。 

深度 学 习 模 型 是 模拟 人 脑 进行 分 析 学 习 的 神经 网 络 ,模仿 人 脑 的 机 制 来 解释 图 像 数据 ， 
深度 学 习 的 第 一 步 实质 上 是 一 个 网 络 参 数 初 始 化 过 程 ,区 别 于 传统 神经 网 络 初 值 随机 初始 
化 ,深度 学 习 模型 是 通过 无 监督 训练 输入 数据 的 结构 得 到 的 ,因而 这 个 初 值 更 接近 全 局 最 
优 ,从 而 能 够 取得 更 好 的 效果 。 在 一 个 技术 方案 中 ,将 卷 积 神经 网 络 作为 此 深度 学 习 模型 ， 
卷 积 神经 网 络 (Constitutional Neural Networks, CNN) 是 在 多 层 神经 网 络 的 基础 上 发 展 起 
来 的 针对 图 像 分 类 和 识别 而 特别 设计 的 一 种 深度 学 习 方法 。 

已 训练 的 深度 学 习 模型 是 与 待 匹 配 的 对 象 的 数据 格式 和 输出 格式 匹配 度 最 高 的 。 已 训 
练 的 深度 学 习 模型 包括 输入 层 ,多 个 隐藏 层 和 输出 层 ,其 中 层 数 ,每 层 预 设 节点 数 .各 网 络 连 
接 的 权 值 由 训练 得 到 。 在 一 个 技术 方案 中 ,根据 已 训练 的 深度 学 习 模型 的 预 设 数据 格式 对 
请 求 匹 配对 象 图 片 及 每 一 候选 待 推荐 对 象 图 片 进行 预 处 理 ,具体 包括 : 判断 请 求 匹 配对 旬 
图 片 及 每 一 候选 待 推荐 对 象 图 片 中 的 各 个 图 片 与 预 设 数据 格式 是 否 一 致 ,否则 将 图 片 的 格 
式 转化 为 预 设 数据 格式 。 

已 婚 匹 配对 象 是 指法 定 效力 内 的 结婚 登记 对 象 ,获取 数据 量 足 够 大 的 已 婚 匹 配对 象 对 
应 的 匹配 图 像 大 数据 作为 深度 学 习 模型 的 训练 数据 进行 训练 ,得 到 深度 学 习 模型 的 参数 。 
在 一 个 技术 方案 中 ,匹配 对 象 对 应 的 匹配 图 像 大 数据 包括 已 婚 匹 配对 象 双方 的 人 脸 图 片 , 还 
可 以 包括 双方 的 地 域 、 结 婚 登 记 地 域 、. 年 龄 信息 形成 多 维度 的 输入 训练 数据 进行 训练 。 可 针 
对 不 同 结婚 登记 地 区 生成 对 应 的 不 同 的 已 训练 的 深度 学 习 模 型 ,提高 不 同 地 区 对 象 匹 配 的 
适应 度 与 准确 性 。 由 于 法 定 效力 内 的 结婚 登记 对 象 代表 匹配 成 功 .根据 匹 配 成 功 对 象 的 图 
像 信息 ,形成 客观 的 科学 依据 大 数据 进行 深度 网 络 分 析 , 提 高 了 匹配 对 象 的 客观 依据 性 。 

(3) 步骤 S3 ,获取 已 训练 的 深度 学 习 模型 输出 的 对 应 的 匹配 结果 。 

深度 学 习 模型 输出 的 匹配 结果 形式 不 限 ,可 以 是 匹配 概率 ,也 可 以 是 互 斥 的 匹配 标签 ， 
如 用 *1" 表 示 匹 配 , 用 *0" 表 示 不 匹配 。 已 训练 的 深度 学 习 模 型 可 以 根据 输入 的 待 匹配 对 象 
的 图 像 数据 分 析 输 出 对 应 的 客观 的 匹配 结果 。 
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(4) 步骤 S4, 根 据 匹配 结果 确定 第 一 对 象 与 第 二 对 象 的 匹配 度 。 

如 果 匹 配 结果 是 匹配 概率 , 则 可 根据 匹配 概率 的 大 小 确定 第 一 对 象 与 第 二 对 象 的 匹配 
度 。 如 果 匹 配 结果 是 互 斥 的 匹配 标签 , 则 直接 根据 匹配 标签 的 值得 到 对 应 的 匹配 度 , 如 匹配 
成 功 或 匹配 失败 。 可 将 第 一 对 象 与 多 个 待 匹 配对 象 进行 匹配 度 的 计算 ,获取 最 大 匹配 概率 
的 对 象 作为 目标 匹配 对 象 。 

本 技术 方案 中 ,通过 获取 待 匹配 的 第 一 和 第 二 对 象 图 像 数 据 , 将 第 一 和 第 二 对 象 图 像 数 
据 输入 已 训练 的 深度 学 习 模型 ,深度 学 习 模 型 的 参数 是 根据 已 婚 匹 配对 象 对 应 的 匹配 图 像 
大 数据 训练 得 到 ,获取 已 训练 的 深度 学 习 模型 输出 的 对 应 的 匹配 结果 ,根据 匹配 结果 确定 第 
一 对 象 与 第 二 对 象 的 匹配 度 ,基于 大 数据 和 深度 学 习 模 型 建立 待 匹 配对 象 与 匹配 度 的 相关 
性 ,提供 客观 的 匹配 依据 。 

2. 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹 配 推荐 的 详细 方法 

在 一 个 技术 方案 中 ,如 图 5-15 所 示 ,步骤 Sl 之 前 ,包括 以 下 步骤 : 


步骤 S1' : 获取 待 匹配 的 对 象 对 应 的 预 设 数据 格 
式 和 匹配 结果 预 设 格式 


步 又 S2': 将 预 设 数据 格式 作为 待 输入 格式 ， 将 
匹配 结果 预 设 格 式 作为 待 输出 格式 ， 获 取 与 待 输 
入 格式 和 待 输出 格式 匹配 的 深度 学 习 模型 对 应 的 
初始 配置 信息 


步骤 S3' : 根据 初始 配置 信息 对 深度 学 习 模 型 进 
行 初始 化 配置 


图 5-15 初始 化 配置 的 流程 图 


步骤 S1', 获 取 待 匹配 的 对 象 对 应 的 预 设 数据 格式 和 匹配 结果 预 设 格式 。 

预 设 数据 格式 可 以 通过 预先 设 定 , 也 可 以 通过 如 下 步骤 自动 获取 : 从 待 匹配 的 对 象 对 
应 的 每 一 对 请 求 匹配 对 象 照片 和 候选 待 推荐 对 象 照片 中 每 一 照片 的 格式 信息 中 获取 数据 格 
式 ,如 1080 像素 X1920 像素 ,统计 获取 到 的 不 同 数据 格式 中 每 一 数据 格式 的 照片 的 数量 ， 
获取 最 大 的 数量 对 应 的 数据 格式 ,作为 预 设 数据 格式 。 匹 配 结果 预 设 格式 是 指 需 要 得 到 的 
匹配 结果 的 格式 ,如 果 是 需要 得 到 概率 , 则 预 设 格 式 为 0 一 1 的 小 数 ,如 果 是 需要 得 到 标签 ， 
则 预 设 格式 为 标签 对 应 的 格式 。 

步骤 S2', 将 预 设 数据 格式 作为 待 输入 格式 ,将 匹配 结果 预 设 格式 作为 待 输出 格式 , 获 
取 与 待 输入 格式 和 待 输出 格式 匹配 的 深度 学 习 模型 对 应 的 初始 配置 信息 。 

深度 学 习 模 型 知识 库 中 预先 存 有 各 类 输入 格式 和 输出 格式 对 应 的 深度 学 习 模 型 配置 信 
息 ,需要 从 中 筛选 出 与 当前 待 输入 格式 和 待 输出 格式 匹配 的 深度 学 习 模型 对 应 的 初始 配置 
信息 。 具 体 的 筛选 方式 可 根据 需要 自 定 义 , 如 计算 当前 待 输入 格式 与 深度 学 习 模型 的 候选 
输入 格式 的 输入 匹配 度 ,计算 当前 待 输出 格式 与 候选 输出 格式 的 输出 匹配 度 ,然后 根据 输入 
匹配 度 与 输出 匹配 度 综合 计算 最 终 的 匹配 度 。 将 匹配 度 最 大 的 候选 输入 格式 与 候选 输出 格 
式 对 应 的 深度 学 习 模 型 配置 信息 作为 最 终 的 初始 配置 信息 。 
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配置 信息 是 指 用 于 配置 深度 学 习 模 型 的 信息 ,包括 预 设 层 数 、 每 层 预 设 节点 数 、 各 网 络 
连接 的 预 设 权 值 等 。 

步骤 S3 ,根据 初始 配置 信息 对 深度 学 习 模型 进行 初始 化 配置 。 

将 初始 配置 信息 中 的 各 个 配置 项 分 别 赋予 深度 学 习 模型 中 对 应 的 项 ,从 而 得 到 初始 化 
的 深度 学 习 模型 。 可 以 接受 修改 请 求 ,修改 请 求 携带 修改 配置 项 和 对 应 的 修改 值 ,从 而 根据 
修改 值 对 初始 化 的 深度 学 习 模 型 的 修改 配置 项 进行 修改 。 

本 技术 方案 中 ,通过 预 设 数据 格式 和 匹配 结果 预 设 格式 筛选 得 到 匹配 度 高 的 深度 学 习 
模型 对 应 的 初始 配置 信息 ,能 提高 初始 配置 信息 的 准确 度 。 

在 一 个 技术 方案 中 ,如 图 5-16 所 示 , 步 又 Sl 之 | 


步骤 S1" : 获取 训练 图 像 大 数据 ， 训 练 图 


前 ,包括 以 下 步骤 : 像 大 数据 包括 已 婚 匹 配对 象 对 应 的 匹配 
步骤 S1”, 获 取 训 练 图 像 大 数据 ,训练 图 像 大 数 上 像 大 数据 
据 包 括 已 婚 匹 配对 象 对 应 的 匹配 图 像 大 数据 。 1 


y 旺 训练 深度 学 3 9 | 步骤 S2”， 从 匹配 图 像 大 数据 中 提取 对 应 
训练 图 像 大 数据 是 指 用 于 训练 深度 学 习 模型 的 | ge et UOC 
海量 数据 ,其 中 已 婚 匹 配对 象 对 应 的 匹配 图 像 大 数 | 组 成 匹配 图 像 对 集合 
据 包 括 多 个 不 同 地 区 的 已 婚 匹 配对 象 双方 对 应 的 图 1 


像 数 据 , 如 已 婚 对 象 双方 的 图 片 。 可 以 针对 不 同 地 Ee 和 任意 两 个 已 婚 匹 配 图 像 对 进 


分 别 采用 对 应 地 区 的 训练 攻 训练 得 到 三 形成 非 匹 配 图 像 对 ， 各 个 非 匹 
区 分 别 采用 对 应 地 区 的 训练 图 像 大 数据 训练 得 到 与 | CPA EVER 


地 区 对 应 的 深度 学 习 模型 ,因为 不 同 的 地 区 由 于 地 | 
域 、 人 口 、 风 俗 文 化 的 差异 在 对 象 匹配 度 上 也 存在 差 | 


步骤 S4" : 将 各 个 四 
配 图 像 对 分 别 作为 ; 
对 深度 学 习 


异 , 针 对 不 同 地 区 形成 不 同 的 深度 学 习 模 型 有 利于 
提高 当地 的 匹配 客观 性 与 准确 率 。 

步骤 S2”, 从 匹配 图 像 大 数据 中 提取 对 应 的 各 个 
已 婚 匹 配对 象 对 应 的 匹配 图 像 对 ,各 个 已 婚 匹 配对 
象 对 应 的 匹配 图 像 对 组 成 匹配 图 像 对 集合 。 

匹配 图 像 对 中 是 指 已 婚 匹 配对 象 双 方 的 图 像 ， 
可 为 人 脸 图 像 、 全 身 图 像 等 ,根据 需要 自 定义 需要 的 
图 像 范 围 。 可 通过 人 脸 识 别 算法 从 中 提取 人 脸 得 到 
各 个 已 婚 匹配 对 象 对 应 的 匹配 图 像 对 。 如 已 婚 匹 配 
对 象 包括 A、B、C、D, 则 匹配 图 像 对 分 别 为 {Al， 
Az} +{Bi+Bz}+{Ci+Cz}+{D1+Dz2} ,匹配 图 像 对 集合 | 
P={(Ai,A;,),(Bi,B,),(C.C:).,(Di,D;,)}. 步骤 S7" : 得 到 已 训练 的 深度 学 习 模型 

在 一 个 技术 方案 中 ,匹配 图 像 大 数据 是 结婚 证 
数据 ,从 结婚 证 中 根据 性 别 特征 和 人 脸 特 征 进行 图 
像 识别 ,提取 丈夫 照片 和 妻子 照片 形成 各 个 已 婚 匹 配对 象 对 应 的 匹配 图 像 对 ; 也 可 以 利用 
丈夫 照片 和 妻子 照片 在 结婚 证 中 的 预 设 位 置 ,来 根据 位 置 范 围 对 丈夫 照片 和 妻子 照片 进行 
直接 提取 ,因为 结婚 证 都 是 标准 的 ,丈夫 照片 在 结婚 证 的 固定 位 置 范围 内 ,妻子 照片 也 在 结 
婚 证 的 另 一 固定 位 置 范围 内 ,可 快速 提取 得 到 匹配 图 像 对 ,提高 数据 准备 的 效率 。 

步骤 S3" ,将 任意 两 个 已 婚 匹 配 图 像 对 进行 拆 分 组 合 形成 非 匹配 图 像 对 ,各 个 非 匹 配 图 
像 对 组 成 非 匹配 图 像 对 集合 。 


步骤 S5" : 将 各 个 匹配 图 像 对 作为 深度 学 
习 模型 的 输入 ， 将 匹配 图 像 对 对 应 的 预 设 
匹配 标签 作为 深度 学 习 模型 的 预期 输出 ， 
对 深度 学 习 模型 进行 有 监督 训练 


| 


步 又 S6" : 将 各 个 非 匹配 图 像 对 作为 深度 
学 习 模型 的 输入 ， 将 非 匹 配 图 像 对 对 应 的 
预 设 非 匹 配 标签 作为 深度 学 习 模型 的 预期 
输出 ， 对 深度 学 习 模 型 进行 有 监督 训练 


图 5-16 训练 深度 学 习 模型 的 流程 图 
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将 一 个 匹配 图 像 对 中 的 图 像 与 任意 另 一 个 匹配 图 像 对 中 相同 属性 的 图 像 进行 交换 , 相 
同属 性 是 指 相同 性 别 , 从 而 形成 非 匹 配 图 像 对 ,各 个 非 匹 配 图 像 对 组 成 非 匹 配 图 像 对 集合 。 
如 匹配 图 像 对 集合 P=((A,.A,). (Bi. Bz). (C, C2). (Di,D:))} ,形成 非 匹 配 图 像 对 集合 
Q= (Ay 5B) (AS Gs (A, sD) CBy As) CBC Bis Ds i EAD (Gy Bas (Cos 
DID, Db C2}. 

步骤 SA” ,将 各 个 匹配 图 像 对 和 各 个 非 匹 配 图 像 对 分 别 作为 深度 学 习 模 型 的 输入 ,对 深 
度 学 习 模 型 进行 无 监督 训练 。 

将 各 个 匹配 图 像 对 ,如 (CA ,A:),(B,B:), (CCz), (Di,D:) 分 别 输入 深度 学 习 模 型 ， 
进行 无 监督 训练 ,将 各 个 非 匹 配 图 像 对 ,如 (Ai,B,),(Ai,C:),(Ai,D;),(Bi,As),(B，, 
C2) + (By +Dz) (Cy A (GB + (Cys Dz) + (Dy 5 Az) + (Dis Be) s (Di + Co) SP 5) 485 ATR EE 
习 模 型 ,进行 无 监督 训练 。 采 用 自 下 而 上 的 无 监督 训练 , 逐 层 构建 单 层 神 经 元 ,每 层 采用 
Wake-Sleep 算法 进行 调 优 。 每 次 仅 调 整 一 层 , 逐 层 调整 ,这 个 过 程 可 以 看 作 是 一 个 Feature 
Learning 的 过 程 ,是 和 传统 神经 网 络 区 别 较 大 的 部 分 。Wake-Sleep 算法 分 为 Wake 阶段 和 
Sleep 阶段 ,其 中 Wake 阶段 是 认 知 过 程 ,通过 下 层 的 输入 特征 (Input) 和 向 上 的 认 知 
(Encoder) 权 重 产生 每 一 层 的 抽象 表示 (Code) ,再 通过 当前 的 生成 (Decoder) 权 重 产生 一 个 
重建 信息 (Reconstruction) ,计算 输入 特征 和 重建 信息 残 差 ,使 用 梯度 下 降 修改 层 间 的 下 行 
生成 (Decoder) 权 重 ,也 就 是 "如果 现 实 跟 我 想象 的 不 一 样 , 改 变 我 的 生成 权重 使 得 我 想象 的 
东西 变 得 与 现实 一 样 "。Sleep 阶段 是 生成 过 程 ,通过 上 层 概 念 (Code) 和 向 下 的 生成 
(Decoder) 权 重 , 生 成 下 层 的 状态 ,再 利用 认 知 (Encoder) 权 重 产 生 一 个 抽象 景象 。 利 用 初始 
上 层 概 念 和 新 建 抽 象 景象 的 残 差 , 利 用 梯度 下 降 修改 层 间 向 上 的 认 知 (Encoder) 权 重 , 也 就 
是 “如 果 梦 中 的 景象 不 是 我 脑 中 的 相应 概念 ,改变 我 的 认 知 权重 使 得 这 种 景象 在 我 看 来 就 是 
这 个 概念 ”。 

步骤 S5", 将 各 个 匹配 图 像 对 作为 深度 学 习 模 型 的 输入 .将 匹配 图 像 对 对 应 的 预 设 匹 配 
标签 作为 深度 学 习 模型 的 预期 输出 ,对 深度 学 习 模 型 进行 有 监督 训练 。 

预 设 匹 配 标签 是 匹配 图 像 对 对 应 的 标签 ,表示 匹配 图 像 对 中 的 照片 对 应 的 对 象 是 匹配 
AY. HEA PE Bic PAR HP MCA) Ae) (By + Bo) (Cy ,Cs),(Di,D;) 分 别 作 为 输入 ,将 预 设 匹 
配 标签 ,如 “1” 作 为 输出 ,进行 有 监督 训练 。 

步骤 S6”, 将 各 个 非 匹 配 图 像 对 作为 深度 学 习 模型 的 输入 ,将 非 匹 配 图 像 对 对 应 的 预 设 
非 匹 配 标签 作为 深度 学 习 模 型 的 预期 输出 ,对 深度 学 习 模 型 进行 有 监督 训练 。 

预 设 非 匹配 标签 是 非 匹 配 图 像 对 对 应 的 标签 ,表示 非 匹配 图 像 对 中 的 照片 对 应 的 对 象 
是 非 匹 配 的 。 将 各 个 非 匹 配 图 像 对 ,如 (Ai,B:),(A,Cz), (Ai,D:), (By + Az) + (Bi,C:)， 
(Bi ,D2) ,C1 As) (C1 BC Di DA (DB + (Dy Cs ) 分 别 作为 输入 ,将 预 设 
匹配 标签 ,如 “0” 作 为 输出 ,进行 有 监督 训练 。 

进行 自 项 向 下 的 监督 训练 ,这 一 步 是 在 第 一 步 学 习 获 得 各 层 参 数 进 的 基础 上 ,在 最 项 的 
编码 层 添 加 一 个 分 类 器 ,例如 Logistic 回归 、SVM 等 ,而 后 通过 带 标签 数据 的 监督 训练 , 利 
用 梯度 下 降 法 去 微调 整个 网 络 参 数 。 深 度 学 习 的 第 一 步 实质 上 是 一 个 网 络 参数 初始 化 过 
程 ,区 别 于 传统 神经 网 络 初 值 随机 初始 化 ,深度 学 习 模 型 是 通过 无 监督 训练 输入 数据 的 结构 
得 到 的 ,因而 这 个 初 值 更 接近 全 局 最 优 ,从 而 能 够 取得 更 好 的 效果 。 
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步骤 S7", 得 到 已 训练 的 深度 学 习 模型 。 

经 过 上 面 的 无 监督 训练 和 有 监督 训练 后 ,得 到 已 训练 的 深度 学 习 模 型 。 

在 一 个 技术 方案 中 ,步骤 S4 包括 : 如 果 匹 配 结果 与 预 设 匹 配 标签 相同 , 则 确定 第 一 对 
象 与 第 二 对 象 的 匹配 度 为 匹配 成 功 ; 如 果 匹 配 结果 与 预 设 非 匹 配 标签 相同 , 则 确定 第 一 对 
象 与 第 二 对 象 的 匹配 度 为 匹配 失败 。 

根据 已 训练 的 深度 学 习 模 型 输出 的 匹配 结果 与 预 设 匹配 标签 是 否 相 同 ,来 判断 第 一 对 象 与 
第 二 对 象 是 否 匹 配 成 功 ,可 直接 得 出 匹配 结果 ,简单 方便 。 预 设 匹 配 标签 和 预 设 非 匹 配 标签 的 格 
式 可 根据 需要 自 定义 ,如 用 标志 位 表示 ,如 "1 表示 预 设 匹 配 标签 “0 表示 预 设 非 匹配 标签 。 

在 一 个 技术 方案 中 ,步骤 Sl 包括 : 接受 请 求 匹配 对 象 用 户 终端 发 送 的 匹配 请 求 ,匹配 
请 求 包括 请 求 匹 配对 象 图 像 数 据 , 将 请 求 匹配 对 象 图 像 数据 作为 第 一 对 象 图 像 数 据 ,获取 待 
推荐 对 象 图 像 数据 作为 第 二 对 象 图 像 数 据 。 

请 求 匹配 对 象 是 指 需要 进行 匹配 的 对 象 ,请 求 匹 配对 象 图 像 数 据 是 请 求 匹 配对 象 的 图 
片 或 根据 图 片 提取 的 特征 数据 , 待 推荐 对 象 是 指 与 请 求 匹配 对 象 进行 匹配 的 候选 对 象 。 匹 
配 请 求 中 可 以 直接 携带 待 推荐 对 象 图 像 数 据 ,也 可 以 从 服务 器 获取 待 推荐 对 象 图 像 数 据 。 
待 推荐 对 象 图 像 数 据 是 与 请 求 匹配 对 象 进行 匹配 的 候选 对 象 的 图 片 或 根据 图 片 提取 的 特征 
数据 。 待 推荐 对 象 图 像 数 据 可 以 根据 待 推荐 对 象 的 更 新 而 动态 的 更 新 。 

在 一 个 技术 方案 中 ,从 婚恋 匹配 网 站 获取 注册 用 户 的 资料 图 片 形 成 待 推荐 对 象 图 像 数 
据 , 可 根据 请 求 匹配 对 象 的 基本 资料 筛选 待 推荐 对 象 。 

步骤 S4 之 后 ,进行 以 下 步骤 : 如 果 匹 配 度 为 匹配 成 功 , 则 向 请 求 匹配 对 象 用 户 终端 发 
送 待 推荐 对 象 对 应 的 用 户 信息 。 

如 果 匹 配 度 为 匹配 成 功 , 则 说 明 请 求 匹配 对 象 与 待 推荐 对 象 匹配 ,将 待 推荐 对 象 对 应 的 
用 户 信息 推送 至 请 求 匹配 对 象 用 户 终端 。 只 有 匹配 成 功 , 才 会 进行 推送 ,提高 了 请 求 匹 配对 
象 获 取 待 推荐 对 象 的 有 效 性 与 客观 性 ,提高 请 求 匹配 对 象 的 感 兴趣 度 ,提高 匹配 效率 ,避免 
大 量 无 效 的 待 推荐 对 象 的 推送 对 用 户 形成 干扰 。 


5.3.2 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹配 推荐 系统 


1. 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹配 推荐 系统 的 基本 模块 


在 一 个 技术 方案 中 ,如 图 5-17 所 示 ,提供 了 一 种 推送 待 获取 模块 1 
推荐 对 象 信 息 装置 ,包括 : | 
(1) 获取 模块 1, 用 于 获取 待 匹配 的 第 一 和 第 二 对 象 图 像 匹配 结果 获 
数据 。 取 模 块 2 
(2) 匹配 结果 获取 模块 2, 用 于 将 第 一 和 第 二 对 象 图 像 数 1 
据 输入 已 训练 的 深度 学 习 模 型 ,深度 学 习 模型 的 参数 是 根据 匹配 度 确定 
已 婚 匹 配对 象 对 应 的 匹配 图 像 大 数据 训练 得 到 ,获取 已 训练 wns 
的 深度 学 习 模 型 输出 的 对 应 的 匹配 结果 。 图 5-17 婚恋 对 象 匹配 数据 处 
(3) 匹配 度 确定 模块 3, 用 于 根据 匹配 结果 确定 第 一 对 象 理 装 置 的 结构 框图 


与 第 二 对 象 的 匹配 度 。 
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2. 基于 大 数据 与 深度 学 习 的 婚恋 对 象 匹 配 推荐 系统 的 扩展 模块 


在 一 个 技术 方案 中 ,如 图 5-18 所 示 ,装置 包括 : 

初始 化 配置 模块 4, 用 于 获取 待 匹配 的 对 象 对 应 的 预 设 数据 格式 和 匹配 结果 预 设 格式 ， 
将 预 设 数据 格式 作为 待 输 入 格式 .将 匹配 结果 预 设 格式 作为 待 输 出 格式 ,获取 与 待 输 入 格式 
和 待 输出 格式 匹配 的 深度 学 习 模 型 对 应 的 初始 配置 信息 ,根据 初始 配置 信息 对 深度 学 习 模 
型 进行 初始 化 配置 。 

在 一 个 技术 方案 中 ,初始 化 配置 模块 4 还 用 于 获取 深度 学 习 模型 对 应 的 候选 输入 格式 
和 候选 输出 格式 ,获取 输入 权 值 系 数 和 输出 权 值 系数 ,计算 待 输入 格式 和 候选 输入 格式 的 输 
入 匹配 度 ,计算 待 输出 格式 和 候选 输出 格式 的 输出 匹配 度 , 根 据 输入 权 值 系数 .输入 匹配 度 、 
输出 权 值 系数 、 输 出 匹配 度 计算 得 到 初始 配置 信息 匹配 度 ,根据 初始 配置 信息 匹配 度 获取 与 
待 输入 格式 和 待 输 出 格式 最 匹配 的 目标 候选 输入 格式 和 目标 候选 输出 格式 ,根据 目标 候选 
输入 格式 和 目标 候选 输出 格式 获取 对 应 的 目标 初始 配置 信息 。 

在 一 个 技术 方案 中 ,如 图 5-19 所 示 ,装置 包括 ， 


初始 化 配置 
模块 4 
i 训练 模块 5 
t 
获取 模块 获取 模块 
1 
匹配 结果 获 匹配 结果 区 
取 村 块 2 LAO 
_ 
匹配 度 确定 匹配 度 确定 
模块 3 模块 3 
图 5-18 婚恋 对 象 匹配 数据 处 理 。 ”图 5-19 ”婚恋 对 象 匹配 数据 处 理 
装置 的 结构 框图 (一 ) 装置 的 结构 框图 (二 ) 


训练 模块 5, 用 于 获取 训练 图 像 大 数据 ,包括 已 婚 匹配 对 象 对 应 的 匹配 图 像 大 数据 ,从 
匹配 图 像 大 数据 中 提取 对 应 的 各 个 已 婚 匹 配对 象 对 应 的 匹配 图 像 对 ,各 个 已 婚 匹 配对 象 对 
应 的 匹配 图 像 对 组 成 匹配 图 像 对 集合 ,将 任意 两 个 已 婚 匹配 图 像 对 进行 拆 分 组 合 形成 非 匹 
配 图 像 对 ,各 个 非 匹配 图 像 对 组 成 非 匹配 图 像 对 集合 ,将 各 个 匹配 图 像 对 和 各 个 非 匹 配 图 像 
对 分 别 作为 深度 学 习 模型 的 输入 ,对 深度 学 习 模 型 进行 无 监督 训练 ,将 各 个 匹配 图 像 对 作为 
深度 学 习 模 型 的 输入 ,将 匹配 图 像 对 对 应 的 预 设 匹配 标签 作为 深度 学 习 模 型 的 预期 输出 ,对 
深度 学 习 模型 进行 有 监督 训练 .将 各 个 非 匹 配 图 像 对 作为 深度 学 习 模 型 的 输入 ,将 非 匹配 图 
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像 对 对 应 的 预 设 非 匹配 标签 作为 深度 学 习 模 型 的 预期 输 
出 ,对 深度 学 习 模型 进行 有 监督 训练 ,得 到 已 训练 的 深度 
学 习 模型 。 

在 一 个 技术 方案 中 ,匹配 度 确定 模块 3 还 用 于 如 果 
匹配 结果 与 预 设 匹配 标签 相同 , 则 确定 第 一 对 象 与 第 二 
对 象 的 匹配 度 为 匹配 成 功 , 如 果 匹 配 结果 与 预 设 非 匹 配 
标签 相同 , 则 确定 第 一 对 象 与 第 二 对 象 的 匹配 度 为 匹配 
失败 。 

在 一 个 技术 方案 中 ,获取 模块 1 还 用 于 接受 请 求 匹 
配对 象 用 户 终端 发 送 的 匹配 请 求 ,匹配 请 求 包括 请 求 匹 
配对 象 图 像 数据 ,将 请 求 匹 配对 象 图 像 数 据 作 为 第 一 对 
象 图 像 数据 ,获取 待 推荐 对 象 图 像 数 据 作 为 第 二 对 象 图 
像 数 据 。 

如 图 5-20 所 示 ,装置 包括 : 

发 送 模块 6, 用 于 如 果 匹 配 度 为 匹配 成 功 , 则 向 请 求 
匹配 对 象 用 户 终端 发 送 待 推荐 对 象 对 应 的 用 户 信息 。 


初始 化 配置 
模块 4 


| 


训练 模块 5 


获取 模块 1 


匹配 结果 获 
取 模块 2 


1 
匹配 度 确定 
模块 3 
了 
发 送 模块 6 


图 5-20 婚恋 对 象 匹配 数据 处 理 
装置 的 结构 框图 (三 ) 


深度 学 习 模 型 的 检测 诊断 大 数据 应 用 


学 习 模型 的 应 用 很 多 ,其 中 深度 学 习 模型 的 检测 诊断 大 数据 有 着 非常 重要 的 应 用 
ea Pen 依 断 大 数据 应 用 : 基于 深度 学 习 模 型 和 
大 数据 的 停车 位 检测 ,基于 深度 学 习 模型 面向 自动 诊断 的 医疗 数据 处 理 。 


6.1 基于 深度 学 习 模 型 和 大 数据 的 停车 位 检测 


传统 技术 在 进行 停车 位 检测 时 ,采用 的 是 阔 值 法 或 模式 识别 法 等 方法 [5 。 这 两 种 
方法 抗 干扰 能 力 差 ,而 停车 场 中 车 来 车 往 , 不 同 车 主 停车 模式 千差万别 ,不 同 停车 位 所 受 
的 干扰 不 同 ,所 以 这 种 复杂 的 环境 下 会 出 现 千变万化 的 检测 数据 ,因此 使 用 固定 的 几 个 
闷 值 或 固定 的 几 个 模式 来 识别 停车 位 的 相关 状态 ,容易 出 现 误 识 别 , 无 法 达到 令 人 满意 
的 检测 精度 

本 技术 研究 并 给 出 了 一 种 新 的 基于 深度 学 习 的 停车 位 检测 方法 和 系统 。 方 法 包括 : 获 
取 停 车 场 中 停车 位 上 有 和 否 驻 车 的 相关 检测 数据 ; 获取 停车 场 中 停车 位 上 有 否 驻 车 的 相关 状 
态 ; 将 相关 检测 数据 作为 深度 学 习 模 型 的 输入 ,将 相关 状态 作为 深度 学 习 模 型 的 输出 ,对 深 
度 学 习 模 型 进行 训练 ; 获取 当前 时 刻下 停车 场 中 待 测 停车 位 上 有 和 否 驻 车 的 相关 检测 数据 ; 
将 相关 检测 数据 输入 训练 后 的 深度 学 习 模型 进行 深度 学 习 ; 将 深度 学 习 模型 的 相应 输出 作 
为 待 测 停车 位 上 有 否 驻 车 的 机 器 判定 相关 状态 。 本 技术 采用 深度 学 习 和 深度 学 习 模 型 对 停 
车 位 的 相关 检测 数据 进行 识别 ,可 以 从 千变万化 .干扰 众多 的 停车 位 检测 数据 中 去 伪 存 真 ， 
得 到 的 停车 位 状态 能 达到 令 用 户 满意 的 检测 精度 。 
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6.1.1 基于 深度 学 习 模型 和 大 数据 的 停车 位 检测 方法 


1. 基于 深度 学 习 模 型 和 大 数据 的 停车 位 检测 的 基本 方法 


图 6-1 所 示 为 一 技术 方案 中 停车 位 检测 方法 的 流程 图 ,包括 下 列 步 又 ; 


步骤 S1 : 获取 过 去 任 一 
没有 驻 车 的 第 一 相关 检 


时 刻下 待 测 停车 位 上 有 
测 数 据 


1 


步骤 $S2 : 获取 过 去 任 一 | 


没有 驻 车 的 真实 相关 状 


时 刻下 待 测 停车 位 上 有 
态 


了 


步骤 S3 : 为 待 测 停车 位 
型 作为 第 一 深度 学 习 模 


初始 化 一 个 深度 学 习 模 
型 


了 


步 又 S4 : 对 第 一 深 有 
符合 预 设 条 件 后 成 为 第 


J 进行 训练 ， 直 到 
二 深度 学 习 模型 


了 


步骤 S5 : 获取 待 测 时 刻 
驻 车 的 第 二 相关 检测 数 


下 待 测 停车 位 上 有 没有 
据 


了 


步骤 S6: 将 第 二 相关 检 


测 数据 输入 第 二 深度 学 


习 模型 进行 深度 学 习 


步骤 S7: 将 第 二 深度 学 习 模型 的 相应 输出 作为 
待 测 时 刻下 待 测 停车 位 上 有 没有 驻 车 的 机 器 判 
定 相关 状态 


图 6-1 停车 位 检测 方法 的 流程 图 


(1) 步骤 S1, 获 取 过 去 任 一 时 刻下 待 测 停车 位 上 有 和 否 驻 车 的 第 一 相关 检测 数据 。 

停车 场 中 每 一 个 停车 位 上 会 设 有 采集 用 于 判定 该 停车 位 上 是 否 有 驻 车 的 数据 的 相应 装 
置 ,例如 地 磁 传感器 .红外 传感器 、 摄 像 头 等 ,后 续 通 过 这 些 数 据 检 测 该 停车 位 是 否 驻 车 。 

(2) 步骤 S2 ,获取 过 去 任 一 时 刻下 待 测 停车 位 上 有 和 否 驻 车 的 真实 相关 状态 。 

相关 状态 包括 该 停车 位 被 占用 和 该 停车 位 空闲 。 由 于 真实 相关 状态 需要 作为 深度 学 习 
模型 训练 时 的 输入 ,因此 要 尽量 保证 状态 准确 。 真 实 相 关 状 态 可 以 通过 人 工 查看 获取 ,也 可 
以 通过 设备 自动 检测 获取 ,但 如 前 述 , 不 管 通过 什么 方式 获取 都 要 尽量 保证 状态 准确 。 在 其 
中 一 个 技术 方案 中 ,停车 位 被 占用 和 停车 位 空闲 可 以 分 别 用 0、1 来 表示 ,也 可 以 使 用 其 他 预 
设 的 数值 表示 。 

(3) 步骤 S3 ,为 待 测 停车 位 初始 化 一 个 深度 学 习 模 型 作为 第 一 深度 学 习 模型 。 

(4) 步骤 S4, 对 第 一 深度 学 习 模型 进行 训练 。 

将 第 一 相关 检测 数据 输入 第 一 深度 学 习 模 型 的 输入 层 、 将 真实 相关 状态 输入 第 一 深度 
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学 习 模 型 的 输出 层 , 对 第 一 深度 学 习 模 型 进行 训练 。 一 个 停车 位 的 第 一 相关 检测 数据 和 真 
实 相关 状态 是 一 一 对 应 的 , 即 要 在 同一 时 刻 获 取 该 停车 位 的 第 一 相关 检测 数据 和 真实 相关 
状态 。 步 又 S1 一 S4 为 深度 学 习 模 型 的 训练 阶段 ,重复 对 第 一 深度 学 习 模型 进行 多 次 训练 ， 
直到 第 一 深度 学 习 模型 符合 预 设 条 件 , 将 符合 预 设 条 件 的 第 一 深度 学 习 模型 作为 第 二 深度 
学 习 模 型 ,进行 停车 位 检测 。 从 步骤 S5 开始 为 检测 阶段 。 

(5) 步骤 SS ,获取 待 测 时 刻下 待 测 停车 位 上 有 和 否 驻 车 的 第 二 相关 检测 数据 。 采 用 与 步 
De SL 中 同样 的 装置 获取 该 数据 。 

(6) 步骤 S6 ,将 第 二 相关 检测 数据 输入 第 二 深度 学 习 模 型 进行 深度 学 习 。 

通过 第 二 深度 学 习 模 型 进行 停车 位 检测 。 

(7) 步骤 S7 ,将 第 二 深度 学 习 模 型 的 相应 输出 作为 待 测 时 刻下 待 测 停车 位 上 有 和 否 驻 车 
的 机 器 判定 相关 状态 。 

相关 状态 包括 该 停车 位 被 占用 和 该 停车 位 空闲 。 通 过 机 器 对 待 测 停车 位 上 有 和 否 驻 车 进 
行 自动 检测 。 

传统 技术 在 停车 位 检测 时 ,采用 阔 值 法 或 模式 识别 法 对 停车 位 的 检测 数据 进行 识别 ,得 
到 停车 位 的 相关 状态 。 但 由 于 阔 值 和 模式 是 预 设 好 后 就 固定 不 变 的 ,所 以 对 千变万化 .干扰 
众多 的 停车 位 检测 数据 进行 识别 ,得 到 的 停车 位 状态 无 法 达到 令 用 户 满意 的 检测 精度 。 

上 述 停车 位 检测 方法 ,采用 深度 学 习 模型 对 停车 位 的 相关 检测 数据 进行 识别 ,得 到 停车 
位 的 相关 状态 。 由 于 深度 学 习 模 型 的 检测 精度 远 远 高 于 阀 值 法 和 模式 识别 法 ,所 以 可 以 从 
千变万化 .干扰 众多 的 停车 位 检测 数据 中 去 伪 存 真 , 得 到 的 停车 位 状态 能 达到 令 用 户 满意 的 
检测 精度 。 

2, 基于 深度 学 习 模型 和 大 数据 的 停车 位 检测 的 详细 方法 

在 其 中 一 个 技术 方案 中 ,步骤 S3 具体 包括 将 第 一 深度 学 习 模型 的 输入 层 的 数据 结构 初 
始 化 为 待 测 停车 位 上 有 和 否 驻 车 的 第 一 相关 检测 数据 的 数据 结构 或 可 以 转化 成 的 数据 结构 ， 
将 第 一 深度 学 习 模 型 的 输出 层 的 数据 结构 初始 化 为 待 测 停车 位 上 有 和 否 驻 车 的 真实 相关 状态 
的 数据 结构 或 可 以 转化 成 的 数据 结构 ,并 将 第 一 深度 学 习 模 型 初始 化 出 预 设 层 数 个 中 间 层 ， 
预 设 层 数 是 大 于 或 者 等 于 0 的 整数 。 

步骤 S4 包括 : 将 过 去 任 一 时 刻下 第 一 相关 检测 数据 压缩 成 预 设 层 数组 的 分 辩 率 递减 
的 中 间 数 据 ,每 一 组 中 间 数 据 与 一 个 中 间 层 对 应 ; 然后 将 每 一 组 中 间 数 据 输入 对 应 的 中 
间 层 。 

例如 , 预 设 层 数 为 3。 将 第 一 相关 检测 数据 的 分 辩 率 压缩 50% ,得 到 第 一 组 中 间 数 据 ; 
将 第 一 组 中 间 数 据 的 分 辩 率 压缩 50% ,得 到 第 二 组 中 间 数 据 ; 将 第 二 组 中 间 数 据 的 分 辨 率 
压缩 50% ,得 到 第 三 组 中 间 数 据 。 将 第 一 组 中 间 数 据 输入 第 一 深度 学 习 模 型 的 第 一 个 中 间 
层 , 将 第 二 组 中 间 数 据 输入 第 一 深度 学 习 模 型 的 第 二 个 中 间 层 ,将 第 三 组 中 间 数 据 输入 第 一 
深度 学 习 模 型 的 第 三 个 中 间 层 。 

在 其 中 一 个 技术 方案 中 ,步骤 S4 判断 第 一 深度 学 习 模 型 是 否 符合 预 设 条 件 ,具体 是 通 
过 如 下 步骤 进行 : 获取 某 一 时 刻 (例如 距离 待 测 时 间 最 近 的 过 去 时 刻 ) 下 待 测 停车 位 的 第 一 
相关 检测 数据 及 真实 相关 状态 。 将 该 时 刻下 待 测 停 车 位 的 第 一 相关 检测 数据 输入 第 一 深度 
学 习 模 型 的 输入 层 ,然后 通过 第 一 深度 学 习 模 型 的 深度 学 习 得 到 第 一 深度 学 习 模 型 输出 层 
的 输出 结果 。 将 该 输出 结果 与 该 时 刻下 待 测 停车 位 的 真实 相关 状态 进行 对 比 ,如 果 对 比 得 


P98 数据 处 理 与 深度 学 习 | 


到 的 误差 不 大 于 预 设 阔 值 , 则 符合 预 设 条 件 ,结束 训练 并 将 第 一 深度 学 习 模 型 作为 第 二 深度 
学 习 模 型 ,进入 检测 阶段 ; 否则 判定 为 不 满足 预 设 条 件 , 对 第 一 深度 学 习 模 型 进行 下 一 次 
训练 。 

在 其 中 一 个 技术 方案 中 ,步骤 S4 的 训练 是 对 每 一 个 停车 位 都 单独 训练 一 个 深度 学 习 模 
型 , 即 如果 停 车 场 有 N 个 停车 位 , 则 训练 出 N 个 相应 的 深度 学 习 模 型 。 具 体 地 ,步骤 S1、 步 
又 S2 要 获取 某 个 停车 位 的 很 多 个 不 同时 间 的 第 一 相关 检测 数据 和 真实 相关 状态 ,然后 在 步 
De S4 中 将 每 一 对 第 一 相关 检测 数据 和 真实 相关 状态 分 别 作为 深度 学 习 模型 的 输入 和 输出 
进行 训练 。 如 果 停 车 场 有 N 个 停车 位 ,步骤 S1 和 S2 中 就 要 将 每 个 停车 位 的 数据 单独 分 组 
( 即 分 成 N 组 ) ,步骤 S4 训练 时 单独 使 用 每 个 停车 位 的 数据 训练 出 一 个 对 应 停车 位 的 深度 
学 习 模 型 。 这 样 一 来 ,不 同 的 待 检测 停车 位 有 不 同 的 深度 学 习 模 型 ,可 以 更 个 性 化 地 深度 学 
习 处 于 不 同 干扰 下 的 不 同 的 待 检 测 停 车 位 ,能 使 得 检测 精度 更 高 。 

步骤 S4 对 待 测 停车 位 的 深度 学 习 模 型 进行 训练 时 ,输入 的 第 一 相关 检测 数据 除了 该 停 
车 位 有 和 否 驻 车 的 检测 数据 以 外 ,还 需要 输入 该 车 位 的 相 邻 停车 位 有 否 驻 车 的 检测 数据 。 例 
如 ,要 将 该 停车 位 左边 的 相 邻 停车 位 和 右边 的 相 邻 停车 位 有 和 否 驻 车 的 检测 数据 也 作为 该 售 
车 位 的 深度 学 习 模型 的 输入 。 这 样 做 的 好 处 在 于 能 够 将 相 邻 停车 位 对 该 停车 位 的 干扰 考虑 
进去 (更 远 的 停车 位 对 该 停车 位 的 干扰 相对 较 小 ,可 以 忽略 ), 从 而 使 得 训练 出 来 的 深度 学 习 
模型 可 以 把 相 邻 停车 位 的 干扰 一 并 考虑 ,使 得 相 邻 停车 位 的 干扰 不 会 影响 深度 学 习 模型 对 
该 停车 位 的 检测 精度 。 同 样 ,步骤 S5 中 的 第 二 相关 检测 数据 除了 待 测 停车 位 有 和 否 驻 车 的 检 
测 数据 以 外 ,包括 待 测 车 位 的 相 邻 停车 位 的 有 和 否 驻 车 的 检测 数据 。 可 以 理解 的 ,在 其 他 技术 
方案 中 也 可 以 仅 是 将 该 停车 位 有 和 否 驻 车 的 检测 数据 作为 深度 学 习 模 型 训练 时 的 输入 ,而 不 
输入 相 邻 停车 位 有 和 否 驻 车 的 检测 数据 , 即 第 一 相关 检测 数据 不 包括 相 邻 停车 位 有 否 驻 车 的 
检测 数据 。 

在 另 一 个 技术 方案 中 ,步骤 S4 的 训练 是 面向 停车 场 中 的 所 有 停车 位 进行 训练 ,得 到 一 
个 反映 全 部 停车 位 的 深度 学 习 模 型 ,这 个 深度 学 习 模 型 可 以 供 所 有 的 待 测 停车 位 使 用 ,这 样 
可 以 节省 训练 所 需 的 时 间 / 计 算 资 源 。 

步 又 S4 对 待 测 停车 位 的 深度 学 习 模 型 进行 训练 时 ,输入 的 第 一 相关 检测 数据 除了 该 停 
车 位 有 否 驻 车 的 检测 数据 以 外 ,还 需要 输入 停车 场 中 所 有 其 他 停车 位 上 有 和 否 驻 车 的 检测 数 
据 。 同 样 , 步 又 S5 中 的 第 二 相关 检测 数据 除了 待 测 停车 位 有 和 否 驻 车 的 检测 数据 以 外 ,包括 
停车 场 中 所 有 其 他 停车 位 上 有 和 否 驻 车 的 检测 数据 。 

步骤 S2 的 相关 状态 和 步骤 S7 的 相关 状态 包括 停车 位 上 驻 车 车 辆 的 类 型 ,具体 是 根据 
车 辆 的 大 小 进行 划分 的 。 例 如 ,可 以 划分 为 小 型 车 、 中 型 车 及 大 型 车 ,分 别 用 2、3、4 表示 ,也 
可 以 使 用 其 他 预 设 的 数值 表示 。 划 分 的 标准 可 以 是 车 身 的 长 度 ,例如 设 定 两 个 长 度 国 值 以 
划分 出 3 种 大 小 的 车 型 。 划 分 的 标准 可 以 采用 本 领域 常用 的 划分 标准 ,例如 轿车 的 划分 标 
准 等 ,也 可 以 根据 停车 位 实际 的 尺寸 自 定义 。 

在 其 中 一 个 技术 方案 中 ,第 一 和 第 二 相关 检测 数据 以 图 像 来 表示 ,深度 学 习 模 型 的 训练 
和 深度 学 习 采 用 用 于 图 像 识 别 的 深度 学 习 模 型 的 训练 和 深度 学 习 方法 ,以 相应 地 对 这 些 数 
据 进行 处 理 、 完 成 对 停车 位 的 检测 。 

在 其 中 一 个 技术 方案 中 ,上 述 停车 位 检测 方法 基于 大 数据 进行 应 用 。 具 体 是 步骤 S1 中 
将 获取 到 的 第 一 相关 检测 数据 存储 于 大 数据 ,步骤 S2 中 将 获取 到 的 真实 相关 状态 存储 于 大 
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数据 ,步骤 S4 中 从 大 数据 中 读 取 第 一 相关 检测 数据 作为 深度 学 习 模 型 的 输入 ,步骤 S5 中 将 
获取 到 的 第 二 相关 检测 数据 存储 于 大 数据 ,步骤 S6 中 从 大 数据 中 读 取 第 二 相关 检测 数据 输 
和 训练 后 的 深度 学 习 模型 ,步骤 S7 中 将 机 器 判定 相关 状态 存储 于 大 数据 中 。 


6.1.2 基于 深度 学 习 模型 和 大 数据 的 停车 位 检测 系统 


基于 深度 学 习 模 型 和 大 数据 的 停车 位 检测 系统 ,包括 : 

(1) 训练 输入 数据 获取 模块 1, 用 于 获取 过 去 任 一 时 刻下 停车 场 中 的 待 测 停车 位 上 有 和 否 
驻 车 的 第 一 相关 检测 数据 。 

(2) 训练 输出 数据 获取 模块 2, 用 于 获取 过 去 任 一 时 刻下 待 测 停车 位 上 有 和 否 驻 车 的 真实 

(3) 初始 化 模块 3, 用 于 为 待 测 停车 位 初始 化 一 个 深度 学 习 模 型 ,作为 第 一 深度 学 习 
模型 。 

CA) 训练 模块 4, 将 过 去 任 一 时 刻下 第 一 相关 检测 数据 和 真实 相关 状态 分 别 输 入 第 一 深 
度 学 习 模型 的 输入 层 和 输出 层 , 对 第 一 深度 学 习 模型 进行 训练 ; 多 次 训练 直到 第 一 深度 学 
习 模型 符合 预 设 条 件 , 将 符合 预 设 条 件 的 第 一 深度 学 习 模 型 作为 第 二 深度 学 习 模型 。 

(5) 检测 数据 获取 模块 5, 用 于 获取 待 测 时 刻下 待 测 停车 位 上 有 否 驻 车 的 第 二 相关 检测 
数据 。 

(6) 停车 检测 模块 6, 用 于 将 第 二 相关 检测 数据 输入 第 二 深度 学 习 模 型 进行 深度 学 习 。 

(7) 停车 判定 模块 7, 用 于 将 第 二 深度 学 习 模型 的 相应 输出 作为 待 测 时 刻下 待 测 停车 位 
上 有 和 否 驻 车 的 机 器 判定 相关 状态 。 


6.2 基于 深度 学 习 模 型 面向 自动 诊断 的 医疗 数据 处 理 


随 着 计算 机 技术 的 发 展 , 医 院 利 用 计算 机 来 记录 患者 的 医疗 数据 ,并 将 医疗 数据 存储 到 
服务 器 。 每 天 有 大 量 的 患者 到 医院 就 诊 , 医 生 将 每 个 患者 在 就 诊 过 程 中 产生 的 医疗 数据 存 
储 到 服务 器 中 。 

然而 ,在 将 医疗 数据 存储 到 服务 器 中 后 ,大 量 的 医疗 数据 需要 占用 较 多 的 存储 空间 ,并 
且 这 些 数据 没有 得 到 充分 的 利用 。 同 时 ,患者 到 医院 就 诊 时 ,需要 耗费 大 量 时 间 进 行 各 种 类 
型 的 身体 检查 ,医生 需要 耗费 时 间 对 各 种 检查 结果 进行 详细 研究 ,才能 对 患者 进行 确诊 从 而 
得 到 确诊 结果 ,患者 的 确诊 结果 的 生成 效率 较 低 所 :5 。 

本 技术 研究 并 给 出 了 一 种 新 的 医疗 数据 处 理 系统 和 装置 ,该 系统 包括 体检 数据 采集 设 
备 和 数据 服务 器 ; 体检 数据 采集 设备 用 于 获取 覆盖 待 确诊 患者 身体 各 部 分 的 第 一 体检 数 
据 , 并 将 第 一 体检 数据 发 送 给 数据 服务 器 ; 数据 服务 器 利用 深度 学 习 模 型 对 第 一 体检 数据 
进行 运算 得 到 第 一 体检 数据 对 应 的 确诊 结果 ; 深度 学 习 模 型 是 根据 覆盖 已 确诊 患者 身体 各 
部 分 的 第 二 体检 数据 和 第 二 体检 数据 对 应 的 确诊 数据 训练 得 到 的 。 本 技术 提供 的 医疗 数据 
处 理 系 统 和 装置 ,在 确诊 结果 的 生成 过 程 中 ,无 须 耗 费 过 多 时 间 进 行 各 项 身体 检查 ,也 无 须 
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医生 对 各 项 检查 结果 耗费 时 间 进 行 详 细 研 究 , 只 需 在 接收 到 体检 数据 采集 设备 发 送 的 第 一 
体检 数据 后 , 即 可 根据 学 习 模型 进行 运算 得 到 确诊 结果 ,提高 了 确诊 结果 的 生成 效率 。 


6.2.1 基于 深度 学 习 模型 面向 自动 诊断 的 医疗 数据 处 理 系统 


1. 基于 深度 学 习 模型 面向 自动 诊断 的 医疗 数据 处 理 系 统 的 应 用 环境 

图 6-2 所 示 为 医疗 数据 处 理 系 统 的 应 用 环境 图 ,医疗 数据 分 析 系 统 包 括 体检 数据 采集 
设备 1 和 数据 服务 器 2, 体 检 数 据 采集 设备 1 和 数据 服务 器 2 通过 网 络 连接 。 体 检 采 集 设 
备 1 包括 采集 控制 终端 1-1 ,扫描 部 件 1-2 和 采集 平台 1-3, 采 集 控制 终端 1-1 通过 控制 扫描 
部 件 1-2 和 采集 平台 1-3 采集 位 于 采集 平台 1-3 上 患者 的 体检 数据 。 扫 描 部 件 1-2 具体 可 
以 是 BB 超 设备 中 的 超声 扫描 仪 ,还 可 以 是 CT 设备 中 X 线 管 和 探测 器 ,也 可 以 是 MRI 
(Magnetic Resonance Imaging, 磁 共振 成 像 ) 成 像 设 备 中 的 磁场 发 生 器 无 线 电波 发 生 器 和 
探测 器 。 


体检 数据 采集 设备 1 


图 6-2 医疗 数据 处 理 系统 的 应 用 环境 图 


在 一 个 技术 方案 中 ,体检 数据 采集 设备 1 用 于 获取 履 盖 待 确诊 患者 身体 各 部 分 的 第 一 
体检 数据 ,并 将 第 一 体检 数据 发 送 给 数据 服务 器 2。 

体检 数据 采集 设备 1 对 待 确诊 患者 身体 各 部 位 进行 检查 ,通过 对 待 确诊 患者 身体 各 部 
分 的 检查 生成 患者 的 第 一 体检 数据 ,第 一 体检 数据 为 覆盖 待 确诊 患者 身体 各 部 分 的 体检 数 
据 , 包 括 对 待 确诊 患者 各 部 分 进行 检查 得 到 的 数据 ,具体 可 以 包括 待 确诊 患者 的 全 身体 检 数 
据 。 体 检 数 据 采 集 设备 1 在 获取 到 第 一 体检 数据 后 ,将 其 通过 网 络 发 送 给 数据 服务 器 2。 

在 一 个 技术 方案 中 ,体检 数据 采集 设备 1 可 以 是 医疗 扫描 设备 ,医疗 扫描 设备 用 于 对 待 
确诊 患者 身体 部 分 进行 扫描 来 获取 待 确诊 患者 的 第 一 体检 数据 。 

数据 服务 器 2 用 于 利用 深度 学 习 模 型 对 第 一 体检 数据 进行 运算 得 到 第 一 体检 数据 对 应 
的 确诊 结果 ; 深度 学 习 模 型 是 根据 覆盖 已 确诊 患者 身体 各 部 分 的 第 二 体检 数据 及 其 对 应 的 
确诊 数据 训练 得 到 的 。 

数据 服务 器 2 获取 已 经 确诊 患者 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 ,以 获取 到 的 第 
二 体检 数据 及 其 对 应 的 确诊 数据 作为 训练 样本 ,以 第 二 体检 数据 作为 深度 学 习 模 型 的 输入 ， 
并 将 第 二 体检 数据 对 应 的 已 确诊 患者 的 确诊 数据 作为 深度 学 习 模型 的 输出 ,通过 训练 得 到 
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深度 学 习 模 型 。 在 数据 服务 器 2 将 获取 到 的 第 一 体检 数据 输入 到 训练 得 到 的 深度 学 习 模型 
中 ,深度 学 习 模型 对 第 一 体检 数据 进行 运算 得 到 对 应 的 确诊 结果 ,其 中 确诊 结果 可 以 疾病 名 
称 , 也 可 以 是 疾病 名 称 对 应 的 编码 。 

本 技术 方案 中 ,数据 服务 器 接收 体检 数据 采集 设备 采集 的 待 确诊 患者 的 第 一 体检 数据 ， 
第 一 体检 数据 覆盖 待 确诊 患者 身体 各 部 分 ,可 以 全 面 反 映 患 者 身体 的 健康 状况 。 利 用 覆盖 
已 确诊 患者 身体 各 部 分 的 第 二 体检 数据 训练 得 到 的 深度 学 习 模 型 对 覆盖 待 确诊 患者 身体 各 
部 分 的 第 一 体检 数据 进行 运算 ,通过 深度 学 习 模 型 的 运算 得 到 第 一 体检 数据 对 应 的 确诊 结 
果 。 在 确诊 结果 的 生成 过 程 中 ,无 须 耗费 过 多 时 间 进 行 各 项 身体 检查 ,也 无 须 医生 对 各 项 检 
查 结果 耗费 时 间 进 行 详细 研究 ,只 需 在 接收 到 体检 数据 采集 设备 发 送 的 第 一 体检 数据 后 , 即 
可 根据 深度 学 习 模型 进行 运算 得 到 确诊 结果 ,提高 了 确诊 结果 的 生成 效率 ,进而 辅助 医生 更 
加 快速 、 准 确 、 合 理 地 做 出 诊断 。 

在 一 个 技术 方案 中 ,体检 数据 采集 设备 1 还 用 于 获取 第 二 体检 数据 ,并 将 其 发 送 给 数据 
服务 器 。 

体检 数据 采集 设备 1 为 医疗 扫描 设备 ,医疗 扫描 设备 用 于 对 已 确诊 患者 身体 部 分 进行 
扫描 来 获取 已 确诊 患者 的 第 二 体检 数据 。 体 检 数 据 采 集 设备 1 对 已 确诊 患者 身体 各 部 分 进 
行 扫描 得 到 已 确诊 患者 的 医疗 图 像 ,提取 医 疗 图 像 中 的 特征 区 域 进行 分 析 得 到 已 确诊 患者 
的 覆盖 身体 各 部 分 的 第 二 体检 数据 。 医 疗 图 像 具 体 可 以 是 CT 图 像 .B 超 图 像 和 MRI 图 像 
中 的 至 少 一 种 。 体 检 数 据 采 集 设备 1 将 第 二 体检 数据 发 送 给 数据 服务 器 2。 

数据 服务 器 还 用 于 将 第 二 体检 数据 相应 的 已 确诊 患者 的 确诊 数据 进行 关联 存储 到 医疗 
数据 库 中 ; 从 医疗 数据 库 中 提取 第 二 体检 数据 及 其 对 应 的 确诊 数据 ; 根据 提取 到 的 第 二 体 
检 数 据 及 其 对 应 的 确诊 数据 训练 得 到 深度 学 习 模 型 。 

数据 服务 器 2 在 接收 到 第 二 体检 数据 后 ,提取 第 二 体检 数据 中 已 经 确诊 患者 的 患者 标 
识 , 再 从 确诊 数据 库 中 提取 患者 标识 对 应 的 确诊 数据 。 数 据 服务 器 2 将 同一 个 患者 标识 对 
应 的 确诊 数据 和 第 二 体检 数据 进行 关联 并 存储 到 医疗 数据 库 中 。 

在 一 个 技术 方案 中 ,数据 服务 器 2 同一 个 患者 标识 的 确诊 数据 和 第 二 体检 数据 进行 关 
联 存储 ,具体 可 以 将 同一 个 患者 标识 对 应 的 确诊 数据 和 第 二 体检 数据 对 应 存储 在 医疗 数据 
库 中 。 将 同一 患者 标识 的 确诊 数据 和 第 二 体检 数据 进行 关联 存储 ,还 可 以 分 别提 取 同 一 个 
患者 标识 的 确诊 数据 和 第 二 体检 数据 中 的 特征 数据 ,建立 特征 数据 的 对 应 关系 表 , 通 过 特征 
数据 的 对 应 关系 表 将 同一 个 患者 标识 对 应 的 确诊 数据 和 第 二 体检 数据 关联 ,并 将 关联 后 的 
确诊 数据 和 第 二 体检 数据 存储 到 医疗 数据 库 中 。 也 可 以 通过 患者 标识 将 同一 个 患者 标识 对 
应 的 确诊 数据 和 第 二 体检 数据 进行 关联 ,将 患者 标识 、 确 诊 数据 和 第 二 体检 数据 对 应 存储 在 
医疗 数据 库 中 。 

数据 服务 器 2 从 医疗 数据 库 中 提取 多 个 已 确诊 患者 的 患者 标识 对 应 的 第 二 体检 数据 及 
其 对 应 的 确诊 数据 ,并 根据 提取 到 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 训练 深度 学 习 模 型 。 

本 技术 方案 中 ,将 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 存储 在 医疗 数据 库 中 ,使 医疗 
数据 库 中 存储 着 海量 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 ,并 且 同 一 患者 标识 对 应 的 确 
诊 数 据 和 体检 数据 关联 存储 在 医疗 数据 库 中 ,为 训练 深度 学 习 模 型 提供 了 大 数据 支撑 ,通过 
医疗 数据 库 中 海量 已 确诊 患者 的 数据 对 深度 学 习 模 型 进行 训练 ,提高 了 通过 深度 学 习 模 型 
生成 确诊 结果 的 准确 性 。 
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在 一 个 技术 方案 中 ,数据 服务 器 2 还 用 于 根据 确诊 结果 确定 异常 体检 指标 ; 在 第 一 体 
检 数 据 中 提取 异常 体检 指标 对 应 的 数值 ; 根据 异常 体检 指标 对 应 的 数值 和 确诊 结果 生成 确 
诊 报 告 。 

体检 指标 是 在 体检 数据 中 能 够 反映 人 身体 健康 状况 的 检测 项 目 , 例 如 心率 .血压 和 尿酸 
等 ,每 个 体检 指标 对 应 的 数值 都 有 一 个 正常 范围 ,根据 体检 指标 的 数值 是 否 在 正常 范围 内 可 
以 判断 人 身体 的 健康 状况 。 体 检 指 标的 数值 超出 该 体检 指标 对 应 的 正常 范围 , 则 该 体检 指 
标 为 异常 体检 指标 。 

数据 服务 器 2 在 生成 确诊 结果 后 ,根据 确诊 结果 与 异常 体检 指标 的 对 应 关系 确定 异常 
体检 指标 的 体检 指标 标识 ,根据 确定 的 体检 指标 标识 在 第 一 体检 指标 中 查找 异常 体检 指标 
的 数值 并 提取 ,根据 提取 到 的 异常 体检 指标 的 数值 和 确诊 结果 生成 相应 的 待 确诊 患者 的 确 
诊 报告 。 其 中 确诊 结果 与 异常 体检 指标 的 对 应 关系 可 以 通过 数据 服 器 2 以 医疗 数据 库 中 存 
储 的 部 分 或 全 部 数据 作为 样本 进行 分 析 获 得 。 

本 技术 方案 中 ,在 生成 确诊 结果 后 ,根据 确诊 结果 提取 第 一 体检 数据 中 的 异常 体检 指标 
的 数值 ,根据 确诊 结果 和 异常 体检 指标 的 数值 生成 确诊 报告 ,确诊 报告 可 以 准确 详细 地 反映 
待 确诊 患者 的 健康 状况 。 

在 一 个 技术 方案 中 ,数据 服务 器 还 用 于 提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,分 别 对 各 
体检 指标 的 数值 进行 编码 生成 各 体检 指标 对 应 的 编码 数据 ,编码 数据 包括 指标 标识 和 指标 数 
值 ; 将 编码 数据 输入 深度 学 习 模 型 ,使 深度 学 习 模 型 将 编码 数据 输入 到 与 编码 数据 中 指标 标 
识 对 应 的 节点 进行 运算 得 到 运算 结果 ; 根据 运算 结果 确定 第 一 体检 数据 对 应 的 疾病 名 称 。 

数据 服务 器 2 提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,查找 与 体检 指标 名 称 匹配 的 
指标 标识 ,指标 标识 用 于 区 别 不 同体 检 指 标 , 具 体 可 以 是 字符 和 数字 中 的 至 少 一 种 。 将 
指标 标识 添加 到 体检 指标 的 数值 中 形成 编码 数据 ,编码 数据 中 包括 指标 标识 和 指标 数 
值 。 数 据 服 务 器 2 将 编码 数据 输入 到 深度 学 习 模型 中 ,深度 学 习 模型 读 取 编 码 数 据 中 的 
指标 标识 ,并 查找 指标 标识 对 应 的 节点 ,提取 编码 数据 中 的 指标 数值 ,将 指标 数值 输入 指 
标 标识 对 应 的 节点 。 深 度 学 习 模 型 根据 输入 的 指标 数值 运算 得 到 运算 结果 ,运算 结果 可 
以 是 字符 或 数值 中 的 至 少 一 种 ,查找 与 运算 结果 对 应 的 疾病 名 称 ,并 将 查找 到 的 疾病 名 
称 输出 作为 待 确诊 患者 的 确诊 结果 。 

本 技术 方案 中 ,通过 各 体检 指标 进行 编码 生成 编码 数据 ,根据 编码 数据 中 指标 标识 将 编 
码 数 据 中 的 指标 数值 输入 到 相应 的 深度 学 习 模 型 节点 ,通过 对 体检 指标 进行 编码 保证 了 深 
度 学 习 模 型 节点 的 输入 准确 率 ,从 而 使 得 运算 结果 更 加 准确 。 

在 一 个 技术 方案 中 ,数据 服务 器 2 还 用 于 提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,对 各 
体检 指标 的 数值 进行 标准 化 处 理 得 到 各 体检 指标 的 标准 化 值 ; 将 各 体检 指标 的 标准 化 值 输 
入 深度 学 习 模 型 ,使 深度 学 习 模 型 将 各 体检 指标 的 标准 化 值 输 入 相应 的 节点 ,并 根据 节点 之 
间 的 权重 值 对 各 体检 指标 的 标准 化 值 进行 运算 得 到 第 一 体检 数据 对 应 的 确诊 结果 。 

数据 服务 器 2 提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,通过 标准 化 处 理 将 第 一 体检 数 
据 中 各 体检 指标 的 数值 ,根据 各 体检 指标 的 映射 关系 将 各 体检 指标 的 数值 映射 到 特定 的 数 
值 区 间 中 的 数值 ,其 中 特定 的 数值 区 间 具 体 可 以 是 [一 1,0]`[0.1] 或 [一 1,1]。 

在 一 个 技术 方案 中 ,数据 服务 器 2 利用 体检 指标 的 数值 减 去 该 体检 指标 的 最 小 值得 到 
BE zi ,再 利用 该 体检 指标 的 最 大 值 减 去 最 小 值得 到 差 x; ,利用 zi 除 以 zs 得 到 体检 指标 的 
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数值 在 数值 区 间 [0,1] 中 的 标准 化 值 。 

在 一 个 技术 方案 中 ,数据 服务 器 2 还 用 于 提取 第 一 体检 数据 中 各 体检 指标 对 应 的 值 , 查 
找 提取 到 的 值 不 是 数值 的 体检 指标 ,将 查找 到 的 体检 指标 的 值 转化 成 数值 ,以 各 体检 指标 对 
应 的 数值 为 标准 化 值 。 例 如 ,体检 指标 * 尿 葡萄 糖 ?对 应 的 值 是 “阴性 ,该 体检 指标 对 应 的 值 
不 是 数值 ,将 “阴性 ?转化 为 "1”, 如 果 是 “阳性 ”, 则 将 “阳性 ?转化 为 "0”。 

在 一 个 技术 方案 中 ,第 一 体检 指标 中 各 体检 指标 对 应 的 数值 格式 不 同 ,数据 服务 器 2 对 
各 体检 指标 对 应 的 数值 的 格式 进行 调整 ,使 各 体检 指标 对 应 的 数值 格式 一 致 ,以 格式 调整 后 
的 数值 作为 各 体检 指标 对 应 的 标准 化 值 。 

数据 服务 器 2 在 对 各 体检 指标 的 数值 进行 标准 化 处 理 后 得 到 各 体检 指标 的 标准 化 值 ， 
将 各 体 指标 的 标准 化 值 输入 深度 学 习 模型 ,深度 学 习 模 型 将 各 体检 指标 的 标准 化 值 输入 各 
体检 指标 对 应 的 节点 ,深度 学 习 模 型 根据 各 节点 之 间 的 权重 值 对 输入 的 各 体检 指标 的 标准 
化 值 进行 加 权 运 算 , 通 过 多 次 加 权 运 算得 到 最 终 的 运算 结果 .根据 运算 结果 查找 对 应 的 疾病 
名 称 ,并 将 疾病 名 称 作 为 第 一 体检 数据 对 应 的 确诊 结果 。 

本 技术 方案 中 ,数据 服 服务 器 2 将 第 一 体检 数据 进行 标准 化 处 理 , 得 到 第 一 体检 数据 的 
各 体检 指标 的 标准 化 值 ,利用 深度 学 习 模 型 对 各 体检 指标 的 标准 化 值 进行 运算 ,得 到 确诊 结 
果 。 通 过 对 标准 化 值 进行 计算 ,节省 了 确诊 结果 的 生成 过 程 中 的 运算 资源 ,提高 了 运算 效 
率 , 同 时 也 提高 了 确诊 结果 的 准确 性 和 生成 效率 。 

2, 基于 深度 学 习 模 型 面向 自动 诊断 的 医疗 数据 处 理 系统 的 模块 构成 

如 图 6-3 所 示 ,在 一 个 技术 方案 中 ,提供 一 种 医疗 数据 处 
理 装置 2, 该 装置 包括 : 第 一 数据 获取 模块 2-1 和 确诊 结果 获 


医疗 数据 处 理 装置 2 


得 模块 2-2。 Ra 
第 一 数据 获取 模块 2-1, 用 于 获取 覆盖 待 确诊 患者 身体 各 
部 分 待 确诊 患者 的 第 一 体检 数据 。 确诊 结果 获得 模块 2-2 


对 待 确诊 患者 身体 各 部 位 将 检查 ,通过 对 待 确诊 患者 身 
体 各 部 分 的 检查 生成 患者 的 第 一 体检 数据 ,第 一 体检 数据 为 图 6 3 eye RSH 
米 盖 待 确诊 患者 身体 各 部 分 的 体检 数据 ,包括 对 待 确诊 患者 的 结构 框图 (一 ) 
各 部 分 进行 检查 得 到 的 数据 ,具体 包括 待 确诊 患者 的 全 身体 
检 数 据 。 具 体 可 以 对 待 确诊 患者 进行 著 盖 身体 各 部 分 的 扫描 来 获取 待 确诊 患者 的 第 一 体检 
数据 。 

确诊 结果 获得 模块 2.2, 用 于 利用 深度 学 习 模 型 对 第 一 体检 数据 进行 运算 得 到 第 一 体 
检 数 据 对 应 的 确诊 结果 ; 深度 学 习 模 型 是 根据 获 盖 已 确诊 患者 身体 各 部 分 的 第 二 体检 数据 
及 其 对 应 的 确诊 数据 训练 得 到 的 。 

其 中 深度 学 习 模 型 根据 获取 到 的 已 经 确诊 患者 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 作 
为 训练 样本 ,以 第 二 体检 数据 作为 深度 学 习 模型 的 输入 ,并 以 第 二 体检 数据 对 应 的 已 确诊 串 
者 的 确诊 数据 作为 深度 学 习 模型 的 输出 ,通过 训练 得 到 的 。 将 获取 到 的 第 一 体检 数据 输入 
到 训练 得 到 的 深度 学 习 模型 中 ,深度 学 习 模型 对 第 一 体检 数据 进行 运算 得 到 第 一 体检 数据 
对 应 的 确诊 结果 ,其 中 确诊 结果 可 以 疾病 名 称 , 也 可 以 是 疾病 名 称 对 应 的 编码 。 

本 技术 方案 中 .获取 待 确诊 患者 的 第 一 体检 数据 ,第 一 体检 数据 黎 盖 待 确诊 患者 身体 各 
部 分 ,可 以 全 面 反映 患者 身体 的 健康 状况 。 利 用 著 盖 已 确诊 患者 身体 各 部 分 的 第 二 体检 数 


toa 数据 处 理 与 深度 学 习 | 


据 训练 得 到 的 深度 学 习 模 型 对 覆盖 待 确诊 患者 身体 各 部 分 的 第 
一 体检 数据 进行 运算 ,通过 深度 学 习 模 型 的 运算 得 到 第 一 体检 医疗 数据 处 理 装置 2 
数据 对 应 的 确诊 结果 。 如 图 6-4 所 示 , 在 一 个 技术 方案 中 ,该 医 
疗 数据 处 理 装置 2 包括 : 第 二 数据 获取 模块 2-3、 数 据 关联 存储 
模块 2-4 .关联 数据 提取 模块 2-5 和 深度 学 习 模型 训练 模块 2-6。 HRTF 

第 二 数据 获取 模块 2-3, 用 于 获取 第 二 体检 数据 。 

利用 医疗 扫描 设备 对 已 确诊 患者 身体 部 分 进行 扫描 来 获 关联 数据 提取 模块 2-5 
取 已 确诊 患者 的 第 二 体检 数据 。 具 体 可 以 是 对 已 确诊 患者 身 
体 各 部 分 进行 扫描 得 到 已 确诊 患者 的 医疗 图 像 ,提取 医疗 图 神经 网 络 训 练 模块 2-6 
像 中 的 特征 区 域 进行 分 析 得 到 已 确诊 患者 的 覆盖 身体 各 部 分 
的 第 二 体检 数据 。 医 疗 图 像 具 体 可 以 是 CT 图 像 .B 超 图 像 和 
MRI 图 像 中 的 至 少 一 种 。 体 检 数 据 采 集 设备 1 将 第 二 体检 数 ”| Capen 


第 二 数据 获取 模块 2-3 


第 一 数据 获取 模块 2-1 


据 发 送 给 数据 服务 器 2。 
数据 关联 存储 模块 4, 用 于 将 第 二 体检 数据 相应 的 已 确 向 gg peg mca mse 
诊 患者 的 确诊 数据 进行 关联 存储 到 医疗 数据 库 中 。 前 站 和 框图 CE) 


在 获取 到 第 二 体检 数据 后 ,提取 第 二 体检 数据 中 已 经 确 
诊 患 者 的 患者 标识 ,再 从 确诊 数据 库 中 提取 患者 标识 对 应 的 确诊 数据 。 将 同一 个 患者 标识 
对 应 的 确诊 数据 和 第 二 体检 数据 进行 关联 并 存储 到 医疗 数据 库 中 。 

一 个 技术 方案 中 ,数据 服务 器 2 同一 个 患者 标识 的 确诊 数据 和 第 二 体检 数据 进行 关 
联 存储 ,具体 可 以 将 同一 个 患者 标识 对 应 的 确诊 数据 和 第 二 it a 
库 中 。 将 同一 患者 标识 的 确诊 数据 和 第 二 体检 数据 进行 关联 存储 ,还 可 以 分 别提 取 同 一 
患者 标识 的 确诊 数据 和 第 二 体检 数据 中 的 特征 数据 ,建立 特征 数据 的 对 应 关系 表 ， 通过 特征 
数据 的 对 应 关系 表 将 同一 个 患者 标识 对 应 的 确诊 数据 和 第 二 体检 数据 关联 ,并 将 关联 后 的 
确诊 数据 和 第 二 体检 数据 存储 到 医疗 数据 库 中 。 也 可 以 通过 患者 标识 将 同一 个 患者 标识 对 
应 的 确诊 数据 和 第 二 体检 数据 进行 关联 ,将 患者 标识 .确诊 数据 和 第 二 体检 数据 对 应 存储 在 
医疗 数据 库 中 。 

关联 数据 提取 模块 2-5, 用 于 从 医疗 数据 库 中 提取 第 二 体检 数据 及 其 对 应 的 确诊 数据 。 

深度 学 习 模 型 训练 模块 2-6, 用 于 根据 提取 到 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 训 
练 得 到 深度 学 习 模 型 。 

从 医疗 数据 库 中 提取 多 个 已 确诊 患者 的 患者 标识 对 应 的 第 二 体检 数据 及 其 对 应 的 确诊 
数据 ,以 获取 到 的 第 二 体检 数据 及 其 对 应 的 确诊 ee 以 第 二 体检 数据 作为 深 
度 学 习 模 型 的 输入 ,并 第 二 体检 数据 对 应 的 已 确诊 患者 的 确诊 数据 作为 深度 学 习 模 型 的 输 
出 ,通过 训练 得 到 深度 学 习 模 型 。 

本 技术 方案 中 ,将 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 存储 在 医疗 数据 库 中 ,使 医疗 
数据 库 中 存储 着 海量 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 ,并 且 同 一 患者 标识 对 应 的 确 
诊 数据 和 体检 数据 关联 存储 在 医疗 数据 库 中 ,为 训练 深度 学 习 模型 提供 了 大 数据 支撑 ,通过 
医疗 数据 库 中 海量 已 确诊 患者 的 数据 对 深度 学 习 模 型 进行 训练 ,提高 了 通过 深度 学 习 模型 
生成 确诊 结果 的 准确 性 。 

如 图 6-5 所 示 ,在 一 个 技术 方案 中 ,该 医疗 数据 处 理 装 置 2 包括 : 异常 指标 确定 模块 2-7、 
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异常 数值 提取 模块 2-8 和 确诊 报告 生成 模块 2-9。 


异常 指标 确定 模块 2.7, 用 于 根据 确诊 结果 确定 异常 体检 | “和 寺村? 

ms 第 一 数据 获取 模块 2-1 
异常 数值 提取 模块 2.8, 用 于 在 第 一 体检 数据 中 提取 异常 

体检 指标 对 应 的 数值 。 确诊 结果 获得 模块 2-2 
确诊 报告 生成 模块 2.9. 用 于 根据 异常 体检 指标 对 应 的 数 

值 和 确诊 结果 生成 确诊 报告 Ee 


体检 指标 是 在 体检 数据 中 能 够 反映 人 身体 健康 状况 的 检 
测 项 目 ,例如 心率 ,血压 和 尿酸 等 ,每 个 体检 指标 对 应 的 数值 异常 数值 提取 模 块 2-8 
都 有 一 个 正常 范围 ,根据 体检 指标 的 数值 是 否 在 正常 范围 内 
可 以 判断 人 身体 的 健康 状况 。 体 检 指 标的 数值 超出 该 体检 指 
标 对 应 的 正常 范围 , 则 该 体检 指标 为 异常 体检 指标 。 wee ened 
在 生成 确诊 结果 后 ,根据 确诊 结果 与 异常 体检 指标 的 对 的 结构 框图 (三 
应 关系 确定 异常 体检 指标 的 体检 指标 标识 ,根据 确定 的 体检 
指标 标识 在 第 一 体检 指标 中 查找 异常 体检 指标 的 数值 并 提取 ,根据 提取 到 的 异常 体检 指标 
的 数值 和 确诊 结果 生成 相应 的 待 确诊 患者 的 确诊 报告 。 其 中 确诊 结果 与 异常 体检 指标 的 对 
应 关系 可 以 通过 数据 服 器 2 以 医疗 数据 库 中 存储 的 部 分 或 全 部 数据 作为 样本 进行 分 析 获 
得 ,也 可 以 是 预先 设置 的 确诊 结果 与 异常 体检 指标 的 对 应 关系 表 。 
本 技术 方案 中 ,在 生成 确诊 结果 后 ,根据 确诊 结果 提取 第 一 体检 数据 中 的 异常 体检 指标 
的 数值 ,根据 确诊 结果 和 异常 体检 指标 的 数值 生成 确诊 报告 ,确诊 报告 可 以 准确 详细 地 反映 
待 确诊 患者 的 健康 状况 。 


确诊 报告 生成 模块 2-9 


如 图 6-6 所 示 ,在 一 个 技术 方案 中 ,确诊 结果 获得 模块 2-2 

确诊 结果 获得 模块 2-2 包括 : 体检 数值 提取 模块 2-2-1、 体 检 数 值 编码 模块 2-2-2、 编 
码 数据 运算 模块 2-2-3 和 疾病 名 称 确定 模块 2-2-4。 
体检 数值 提取 模块 2-2-1 体检 数值 提取 模块 2-2-1, 用 于 提取 第 一 体检 数据 中 各 体 
检 指 标的 数值 。 

体检 数值 编码 模块 -2-2, 用 于 分 别 对 各 体检 指标 的 数值 
后 0 下 出 冯 税 模 记 223| | 进行 编码 生成 各 体检 指标 对 应 的 编码 数据 ,包括 指标 标识 和 
指标 数值 。 
疾病 名 称 确定 模块 -2-4 编码 数据 运算 模块 2-2-3 .用 于 将 编码 数据 输入 深度 学 习 
模型 ,使 深度 学 习 模型 将 编码 数据 输入 到 与 编码 数据 中 指标 

图 6-6 确诊 结果 获取 模块 ”标识 对 应 的 节点 进行 运算 得 到 运算 结果 。 

的 结构 框图 (一 ) 疾病 名 称 确定 模块 2-2-4, 用 于 根据 运算 结果 确定 第 一 体 
检 数 据 对 应 的 疾病 名 称 。 

体检 数据 提取 模块 提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,查找 与 体检 指标 名 称 匹 配 
的 指标 标识 ,指标 标识 用 于 区 别 不 同 的 体检 指标 ,具体 可 以 是 字符 和 数字 中 的 至 少 一 种 。 将 
指标 标识 添加 到 体检 指标 的 数值 中 形成 编码 数据 ,包括 指标 标识 和 指标 数值 ,编码 数据 具体 
可 以 是 二 进 制 数 。 数 据 服务 器 2 将 编码 数据 输入 到 深度 学 习 模 型 中 ,深度 学 习 模 型 读 取 编 
码 数据 中 的 指标 标识 ,并 查找 指标 标识 对 应 的 节点 ,提取 编码 数据 中 的 指标 数值 ,将 指标 数 


体检 数值 编码 模块 2-2-2 
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值 输入 指标 标识 对 应 的 节点 。 深 度 学 习 模 型 根据 输入 的 指标 数值 运算 得 到 运算 结果 ,运算 
结果 可 以 是 字符 或 数值 中 的 至 少 一 种 ,查找 与 运算 结果 对 应 的 疾病 名 称 , 并 将 查找 到 的 疾病 
名 称 输出 作为 待 确诊 患者 的 确诊 结果 。 

本 技术 方案 中 ,通过 各 体检 指标 进行 编码 生成 编码 数据 ,根据 编码 数据 中 指标 标识 将 编 
码 数 据 中 的 指标 数值 输入 到 相应 的 深度 学 习 模型 节点 ,通过 对 体检 指标 进行 编码 保证 了 深 
度 学 习 模 型 节点 的 输入 准确 率 , 从 而 使 得 运算 结果 更 加 准确 ,进而 辅助 医生 更 加 快速 准确 、 
合理 地 做 出 诊断 。 

如 图 6-7 所 示 ,在 一 个 技术 方案 中 ,确诊 结果 获得 模块 2-2 


和 包括, 指标 数值 提取 模块 2.2.5、 指标 数值 处 理 模块 2-6 和 标 “| 。 RRR BRA2 

准 化 值 运算 模块 2 2-7。 指标 数值 提取 模块 2-2- 
指标 数值 提取 模块 2.2.5, 用 于 提取 第 一 体检 数据 中 各 体 

检 指 标的 数值 。 指标 数值 处 理 模块 2-2- 
指标 数值 处 理 模块 2.2.6, 用 于 对 各 体检 指标 的 数值 进行 


标准 化 处 理 得 到 各 体检 指标 的 标准 化 值 。 标准 化 值 运算 模块 2-2- 

提取 第 一 体检 数据 中 各 体检 指标 的 数值 ,通过 标准 化 处 
理 将 第 一 体检 数据 中 各 体检 指标 的 数值 根据 各 体检 指标 的 映 ” 图 6-7 确诊 结果 获取 模块 
射 关系 映射 到 特定 的 区 间 中 的 数值 ,其 中 特定 的 区 间 具 体 可 的 结构 框图 (二 ) 

以 是 [一 1,0].[0,1] 或 [一 1,1]。 

在 一 个 技术 方案 中 ,利用 体检 指标 的 数值 减 去 该 体检 指标 的 最 小 值得 到 差 x ,再 利用 
该 体检 指标 的 最 大 值 减 去 最 小 值得 到 差 zs ,利用 zi 除 以 zs 得 到 体检 指标 的 数值 在 区 间 
[0,1] 中 的 标准 化 值 。 

在 一 个 技术 方案 中 ,数据 服务 器 2 还 用 于 提取 第 一 体检 数据 中 各 体检 指标 对 应 的 值 ,如 
查找 提取 到 的 值 不 是 数值 的 体检 指标 ,将 查找 到 的 体检 指标 的 值 转化 成 数值 ,以 各 体检 指标 
对 应 的 数值 为 标准 化 值 。 例 如 ,体检 指标 * 尿 葡萄 糖 " 对 应 的 值 是 “阴性 ”, 该 体检 指标 对 应 的 
值 不 是 数值 ,将 “阴性 ”转化 为 “1”, 如 果 是 “阳性”, 则 将 “阳性 ”转化 为 “0”。 

在 一 个 技术 方案 中 ,第 一 体检 指标 中 各 体检 指标 对 应 的 数值 格式 不 同 ,数据 服务 器 2 对 
各 体检 指标 对 应 的 数值 的 格式 进行 调整 ,使 各 体检 指标 对 应 的 数值 格式 一 致 ,以 格式 调整 后 
的 数值 作为 各 体检 指标 对 应 的 标准 化 值 。 

标准 化 值 运 算 模块 2-2-7, 用 于 将 各 体检 指标 的 标准 化 值 输入 深度 学 习 模型 ,使 深度 学 
习 模 型 将 各 体检 指标 的 标准 化 值 输入 相应 的 节点 ,并 根据 深度 学 习 模型 中 节点 之 间 的 权重 
值 对 各 体检 指标 的 标准 化 值 进行 运算 得 到 第 一 体检 数据 对 应 的 确诊 结果 。 

在 对 各 体检 指标 的 数值 进行 标准 化 处 理 后 得 到 各 体检 指标 的 标准 化 值 ,将 各 体 指标 的 
标准 化 值 输入 深度 学 习 模 型 ,深度 学 习 模型 将 各 体检 指标 的 标准 化 值 输入 各 体检 指标 对 应 
的 节点 ,深度 学 习 模 型 根据 各 节点 之 间 的 权重 值 对 输入 的 各 体检 指标 的 标准 化 值 进行 加 权 
运算 ,通过 多 次 加 权 运 算得 到 最 终 的 运算 结果 ,根据 运算 结果 查找 对 应 的 疾病 名 称 ,并 将 疾 
病名 称 作为 第 一 体检 数据 对 应 的 确诊 结果 。 

本 技术 方案 中 ,数据 服务 器 2 将 第 一 体检 数据 进行 标准 化 处 理 , 得 到 第 一 体检 数据 的 各 
体检 指标 的 标准 化 值 ,利用 深度 学 习 模 型 对 各 体检 指标 的 标准 化 值 进行 运算 ,得 到 确诊 结 
果 。 通 过 对 标准 化 值 进行 计算 ,节省 了 确诊 结果 的 生成 过 程 中 的 运算 资源 ,提高 了 运算 效 
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率 , 同 时 也 提高 了 确诊 结果 的 准确 性 和 生成 效率 。 


6.2.2 基于 深度 学 习 模 型 面向 自动 诊断 的 医疗 数据 处 理 方法 


如 图 6-8 所 示 ,在 一 个 技术 方案 中 ,提供 一 种 医疗 数据 处 理 方法 ,该 方法 具体 包括 以 下 
步 又: 


步骤 S1 : 获取 覆盖 待 确诊 患者 身体 各 部 分 的 第 一 体检 数据 


步骤 S2 : 利用 学 习 模型 对 第 一 体检 数据 进行 运算 得 到 第 一 
体检 数据 对 应 的 确诊 结果 ; 学 习 模型 是 根据 覆盖 已 确诊 患 
者 身体 各 部 分 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 训练 得 
到 的 


图 6-8 医疗 数据 处 理 方 法 的 流程 示意 图 


(1) 步骤 S1, 获 取 歼 盖 待 确诊 患者 身体 各 部 分 的 第 一 体检 数据 。 

(2) 步骤 S2 ,利用 深度 学 习 模 型 对 第 一 体检 数据 进行 运算 得 到 第 一 体检 数据 对 应 的 确 
诊 结果 ; 深度 学 习 模 型 是 根据 覆盖 已 确诊 患者 身体 各 部 分 的 第 二 体检 数据 及 其 对 应 的 确诊 
数据 训练 得 到 的 。 

本 技术 方案 中 ,获取 待 确诊 患者 的 第 一 体检 数据 ,第 一 体检 数据 覆盖 待 确诊 患者 身体 各 
部 分 ,可 以 全 面 反映 患者 身体 的 健康 状况 。 利 用 覆盖 已 确诊 患者 身体 各 部 分 的 第 二 体检 数 
据 训 练 得 到 的 深度 学 习 模型 对 材 盖 待 确诊 患者 身体 各 部 分 的 第 一 体检 数据 进行 运算 ,通过 
深度 学 习 模型 的 运算 得 到 第 一 体检 数据 对 应 的 确诊 结 

(3) 在 一 个 技术 方案 中 ,步骤 Sl 之 前 包括 训练 深度 学 习 模 型 的 步骤 ,具体 步骤 如 下 : 
获取 第 二 体检 数据 ; 将 第 二 体检 数据 相应 的 已 确诊 患者 的 确诊 数据 进行 关联 存储 到 医疗 数 
据 库 中 ; 从 医疗 数据 库 中 提取 关联 的 第 二 体检 数据 及 其 对 应 的 确诊 数据 ; 根据 提取 到 的 第 
二 体检 数据 及 其 对 应 的 确诊 数据 训练 得 到 深度 学 习 模 型 。 

本 技术 方案 中 ,将 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 存储 在 医疗 数据 库 中 ,使 医疗 
数据 库 中 存储 着 海量 已 确诊 患者 的 确诊 数据 和 第 二 体检 数据 ,并 且 同 一 患者 标识 对 应 的 确 
诊 数据 和 体检 数据 关联 存储 在 医疗 数据 库 中 ,为 训练 深度 学 习 模 型 提供 了 大 数据 支撑 ,通过 
医疗 数据 库 中 海量 已 确诊 患者 的 数据 对 深度 学 习 模 型 进行 训练 ,提高 了 通过 深度 学 习 模型 
生成 确诊 结果 的 准确 性 。 

(A) 在 一 个 技术 方案 中 ,步骤 S2 之 后 包括 确诊 报告 的 生成 步骤 : 根据 确诊 结果 确定 异 
常 体检 指标 ; 在 第 一 体检 数据 中 提取 异常 体检 指标 对 应 的 数值 ; 根据 异常 体检 指标 对 应 的 
数值 和 确诊 结果 生成 确诊 报告 。 

本 技术 方案 中 ,在 生成 确诊 结果 后 ,根据 确诊 结果 提取 第 一 体检 数据 中 的 异常 体检 指标 
的 数值 ,根据 确诊 结果 和 异常 体检 指标 的 数值 生成 确诊 报告 ,确诊 报告 可 以 准确 详细 地 反映 
待 确诊 患者 的 健康 状况 ,进而 辅助 医生 更 加 快速 、 准 确 、 合 理 地 做 出 诊断 。 

(5) 在 一 个 技术 方案 中 ,步骤 S2 具体 包括 指标 数值 的 编码 步骤 : 提取 第 一 体检 数据 中 
各 体检 指标 的 数值 ; 分 别 对 各 体检 指标 的 数值 进行 编码 生成 各 体检 指标 对 应 的 编码 数据 ， 
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编码 数据 包括 指标 标识 和 指标 数值 ; 将 编码 数据 输入 深度 学 习 模 型 ,使 深度 学 习 模 型 将 编 
码 数 据 输入 到 与 编码 数据 中 指标 标识 对 应 的 节点 进行 运算 得 到 运算 结果 ; 根据 运算 结果 确 
定 第 一 体检 数据 对 应 的 疾病 名 称 。 

本 技术 方案 中 ,通过 各 体检 指标 进行 编码 生成 编码 数据 ,根据 编码 数据 中 指标 标识 将 编 
码 数 据 中 的 指标 数值 输入 到 相应 的 深度 学 习 模型 节点 ,通过 对 体检 指标 进行 编码 保证 了 深 
度 学 习 模 型 节点 的 输入 准确 率 , 从 而 使 得 运算 结果 更 加 准确 。 

(6) 在 一 个 技术 方案 中 ,步骤 S2 具体 包括 标准 化 处 理 步 骤 : 提取 第 一 体检 数据 中 各 体 
检 指 标的 数值 ; 指标 数值 处 理 模块 ,用 于 对 各 体检 指标 的 数值 进行 标准 化 处 理 得 到 各 体检 
指标 的 标准 化 值 ; 标准 化 值 运算 模块 ,用 于 将 各 体检 指标 的 标准 化 值 输入 深度 学 习 模 型 ,使 
深度 学 习 模 型 将 各 体检 指标 的 标准 化 值 输入 相应 的 节点 ,并 根据 深度 学 习 模型 中 节点 之 间 
的 权重 值 对 各 体检 指标 的 标准 化 值 进行 运算 得 到 第 一 体检 数据 对 应 的 确诊 结果 。 

本 技术 方案 中 ,数据 服务 器 2 将 第 一 体检 数据 进行 标准 化 处 理 , 得 到 第 一 体检 数据 的 各 
体检 指标 的 标准 化 值 ,利用 深度 学 习 模 型 对 各 体检 指标 的 标准 化 值 进行 运算 ,得 到 确诊 结 
果 。 通 过 对 标准 化 值 进行 计算 ,节省 了 确诊 结果 的 生成 过 程 中 的 运算 资源 ,提高 了 运算 效 
率 , 同 时 也 提高 了 确诊 结果 的 准确 性 和 生成 效率 ,进而 辅助 医生 更 加 快速 .准确 、 合 理 地 做 出 
诊断 。 
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结 束 语 


深度 学 习 模型 之 所 以 能 够 火 起 来 ,得 益 于 大 数据 技术 的 发 展 , 正 是 因为 大 数据 技术 ,使 
得 海量 数据 的 深度 学 习 成 为 可 能 。 同 时 深度 学 习 模 型 的 发 展 ,势必 进一步 促进 大 数据 智能 
处 理 能 力 的 提高 。 深 度 学 习 与 大 数据 的 共同 作用 是 产生 智能 ,为 人 类 服务 。 

深度 学 习 离 不 开 大 数据 ,因为 如 果 没 有 海量 的 数据 样本 进行 训练 ,深度 学 习 模 型 无 法 获 
得 很 高 的 准确 率 ,同时 如 果 没 有 大 数据 的 处 理 能 力 ,深度 学 习 模型 的 层 数 就 会 受到 限制 而 无 
法 达到 一 定 深度 ,从 而 无 法 实现 深度 学 习 的 功能 。 

大 数据 离 不 开 深度 学 习 , 因 为 大 数据 与 小 数据 不 同 的 是 大 数据 要 挖掘 的 知识 模式 往往 
不 明确 ,也 就 是 说 ,难以 用 公式 或 者 模型 刻画 ,此 时 深度 学 习 模 型 就 有 了 英雄 用 武之 地 ,因为 
深度 学 习 模 型 中 可 以 蕴涵 极其 复杂 的 难以 刻画 的 模型 。 


